ホーマー・ダドリー

ホーマー・W・ダドリー(1896年11月14日 - 1980年9月18日)は、アメリカの電子音響工学の先駆者であり、 1930年代にベル研究所で世界初の電子音声合成装置を開発し、第二次世界大戦中には安全な音声通信方式の開発を主導しました。受賞歴には、フランクリン研究所のスチュアート・バランタイン・メダル(1965年)などがあります。

若いころ

バージニア州生まれのダドリーは、学生の頃に家族とペンシルベニア州に引っ越した。父親は牧師で、両親も古典や宗教の授業を生徒に行わせていた。ダドリーは小学校と高校の教師になるための訓練を受けた。教室で規律を保つのが難しく、すぐに教師を辞めた。転職を考え、ペンシルベニア州立大学に入学し、そこで当時まだ黎明期にあった電子工学に興味を持つようになった。大学で電子工学のコースをいくつか履修した後、ダドリーは当時ウエスタン・エレクトリック・カンパニーの一部門だったベル研究所に就職した。ベル研究所での彼のキャリアは40年に及び、その大半は電話伝送部門で過ごした。[ 1 ]

健全な理論

ダドリーの主な研究分野は、人間の発話は基本的にキャリア音、つまり口、喉、副鼻腔によって変調・整形され、認識可能な音声へと変化する、多かれ少なかれ連続的な音の利用であるという考え方でした。声帯はキャリア音を作り出し、喉、口、副鼻腔によってフォルマントへと形作られ、私たちが母音(「アー」「イー」「ウー」など)として認識する音へと変化します。そして、これらはさらに破裂音(例えば、唇を押し合わせて「p」の音を作る)や声門閉鎖音(例えば、喉の奥を閉じて「グー」の音を作る)によって形作られます。ダドリーは、音をモジュールブロックに分解し、それらを任意の順序で組み立てることで、人間の発話に類似した理解可能な音声を作り出すことができ、人工音声による生成とコミュニケーションが可能になるという理論を立てました。人間の話し手の自然な搬送音を、より高い周波数の搬送音に置き換えると、より高い周波数の音はより低い周波数の音よりも明瞭に聞こえるため、遠くまで、また音量が小さい場合でも、話し手はより明瞭に再現されます。

VOCODERとVODER

1928年、ダドリーは人間の音声に類似した音声を生成するための電気機械装置の実験を始めました。このプロセスの鍵となったのは、並列バンドパスフィルタの開発でした。このフィルタは、特定の帯域を超える音または帯域以下の音を減衰させることで、音声スペクトルのかなり特定の領域にまで音をフィルタリングすることを可能にしました。この成果は、「ボコーダ」( 「voice(音声)」と「encoder(エンコーダ)」を組み合わせた造語)の特許取得につながりました。これは、電子的な手段で音声を再生し、電話回線などを介して遠距離伝送を可能にする手法です。人間の音声を電子的に再生することで、音声の要素を10の特定の音声スペクトル帯域にフィルタリングすることができ、電話回線を介してより明瞭で読みやすい音声を伝送することが容易になりました。また、音声を非常に狭い周波数帯域に圧縮することで、異なる帯域で同時に複数の伝送を行うことも可能になりました。これにより、1本の回線で多数の電話会話を同時に伝送することが可能になりました。[ 1 ]

同僚の技術者ロバート・リースの協力を得て、ダドリーは「VODER」(「Voice Operation DEmonstratoR」の略)を開発した。[ 2 ]これは、オペレーターがキーボードとフットペダルでVOCODERを操作して音声フレーズを作成できるコンソールであるが、操作が難しいと考えられていた。VODERは、1939年のニューヨーク万国博覧会と1939年のゴールデンゲート国際博覧会の両方でベル研究所の展示で実演された。コンソールの後ろに女性オペレーターが座り、人間の話し言葉に似たフレーズを観客に実演できたが、生成された音は理解しにくいことが多かった。[ 1 ]

1938年6月21日、ダドリーとベル研究所は「人工的に音声やその他の音を生成するシステム」に関する特許(US#2,121,142)を取得した。[ 3 ]

SIGSALYと戦時中のプロジェクト

ダドリーはアラン・チューリングと共に、米軍のSIGSALYプロジェクトに携わりました。SIGSALYは、音声を安全に伝送し、権限のない傍受者には理解できないようにする手法でした。VOCODERおよびVODERプロジェクトで開発された技術を活用し、音声を暗号化する手法としてランダムノイズ源を追加しました。SIGSALYは第二次世界大戦中、米軍情報部によって 最高レベルの機密メッセージの伝送に効果的に使用されました。

後のプロジェクト

ダドリーは1960年代初頭までベル研究所に在籍し、電話通信に不可欠な技術を数多く発明・改良した。彼が開発した人工音声は、声帯を使えない人間のための人工音声技術(スティーブン・ホーキング博士が使用した音声合成装置など)の開発に活用され、また電子音楽の先駆者であるウェンディ・カルロスロバート・モーグ、そしてドイツの音楽グループ、クラフトヴェルクによっても発展させられた。ダドリーの最後のプロジェクトの一つは、ベル研究所が家庭の愛好家や学生向けに配布した「音声合成:電子音声生成の実験」と呼ばれる電子キットの設計だった。このキットには、3つの異なる音声フォルマントを生成できる電子回路を作成するための部品が含まれていた。このキットは1963年に生産が開始され、1960年代後半まで製造された。

注記

  1. ^ a b cラファエル, ローレンス J.; ボーデン, グロリア J.; ハリス, キャサリン S. (2007). 『音声科学入門:音声の生理学、音響学、知覚』 リッピンコット・ウィリアムズ&ウィルキンス. ISBN 9780781771177
  2. ^テキスト音声合成Archived 2016-03-25 at the Wayback Machine ( Bell Labs )
  3. ^ Googleの特許

さらに読む

  • 『音声科学入門:音声の生理学、音響学、知覚』、Raphael、Borden、Harris(Lippincott)著、23~24ページ。