アレックス・ワイベル | |
|---|---|
2018年のワイベル | |
| 生まれる | (1956年5月2日)1956年5月2日 ハイデルベルク、ドイツ |
| 学歴 | |
| 母校 | マサチューセッツ工科大学(学士)、カーネギーメロン大学(修士、博士) |
| 博士課程の指導教員 | ラジ・レディ |
| 学術研究 | |
| 規律 | コンピュータサイエンス |
| サブ分野 | 人工知能、機械学習、ディープラーニング |
| 機関 | カーネギーメロン大学、カールスルーエ工科大学 |
| 著名な学生 | ローレンス・デビラーズ |
アレクサンダー・ワイベル(Alexander Waibel、1956年5月2日生まれ)は、カーネギーメロン大学[ 1 ]とカールスルーエ工科大学(KIT)[ 2 ]のコンピュータサイエンスの教授です。ワイベルの研究は、自動音声認識、翻訳、ヒューマンマシンインタラクションに焦点を当てています。彼の研究では、さまざまなプラットフォーム上での逐次通訳システムや同時通訳システムなどの異言語コミュニケーションシステムを導入しました。[ 3 ]機械学習の基礎研究では、バックプロパゲーションを使用して勾配降下法でトレーニングされた最初の畳み込みニューラルネットワーク(CNN)である時間遅延ニューラルネットワーク(TDNN)[ 4 ]で知られています。アレックス・ワイベルは1987年に日本の ATRでTDNN [ 5 ]を発表しました。
ヴァイベルはバルセロナで学生時代を過ごした後、ルートヴィヒスハーフェンの人文科学ギムナジウムに入学した。1976年から1979年まで、マサチューセッツ工科大学で電気工学とコンピュータサイエンスを学び、1979年には最優秀学部論文に贈られるギヤマン賞を受賞した。同年、カーネギーメロン大学に入学し、1980年に修士号、1986年にコンピュータサイエンスと認知科学の博士号を 取得した。
ワイベル氏はカールスルーエ工科大学の国際先端コミュニケーション技術センターinterACT [ 6 ]の所長である。また、音声翻訳研究のための国際コンソーシアム C-STAR [ 7 ]の創設者の一人で、1998 年から 2000 年にかけて同コンソーシアムの議長を務めた。2003 年に、C-STAR は国際音声言語翻訳会議 IWSLT [ 8 ] に発展した。ワイベル氏は発足当初からその運営委員会の議長を務めている。[ 9 ]欧州の CHIL プログラム[ 10 ] (マルチモダリティに関する FP-6 統合プロジェクト)や米国の NSF-ITR プロジェクト STR-DUST (初のドメイン非依存音声翻訳プロジェクト) など、欧州と米国の複数のマルチサイト研究プログラムを指導、調整した。さらに、EC の資金提供を受けた IP EU-BRIDGE [ 11 ] (2012-2014) のプロジェクトコーディネーターも務めた。
C-STARでは、彼のチームはアメリカとヨーロッパ初の音声翻訳システムであるJANUS音声翻訳システムを開発し、2005年には講義用初のリアルタイム同時音声翻訳システムも開発しました。彼は研究室で、顔追跡、リップリーディング、音声からの感情認識、知覚会議室、会議認識装置、会議ブラウザ、ヒューマノイドロボット向けマルチモーダル対話システムなど、いくつかのマルチモーダルシステムを開発しました。2020年代初頭、チームは、エンドツーエンドの音声通訳を予測的にリアルタイムで提供できる低遅延同時通訳アルゴリズムを提案しました。[ 12 ]このシステムは、低遅延で超人的なパフォーマンスを発揮できます。[ 13 ]ワイベルと彼のチームは、大規模なニューラルアーキテクチャが音声認識と翻訳において多言語パフォーマンスを発揮し、新しい言語を段階的に追加できることを確立しました。ワイベルは2012年に欧州議会で最初の自動通訳サービスを実演しました。[ 14 ]
2019年から2023年にかけて、彼はドイツ連邦教育研究省の資金提供を受けたOML(有機機械学習)を指揮した。これは、AIが言語やロボット工学における驚きをより適切に処理できるようにすることを目指した、増分型でインタラクティブな機械学習を開発するための基礎研究プロジェクトである。[ 15 ]
音声、音声翻訳、マルチモーダルインターフェースの分野で、ワイベル氏は複数の特許[ 16 ]を保有し、成功を収めた商業ベンチャー企業を共同設立または設立しています。彼は、携帯電話の音声を翻訳するモバイル音声翻訳アプリ 「Jibbigo」を開発するMobile Technologies, LLCの創設者兼会長を務めました。
2005年、ワイベル氏はKITとカーネギーメロン大学での記者会見で世界初の自動同時翻訳サービスを発表した[ 17 ]。「講義翻訳機は、講師のスピーチをリアルタイムで自動的に録音、書き起こし、翻訳し、学生はパソコンや携帯電話で自分の言語で講義を聴くことができる」と述べた[18]。2012年に導入され[ 19 ] 、この種のサービスの先駆者として留学生にサービスを提供している[ 20 ]。
2013年、JibbigoはFacebook社に買収され、ワイベル氏は同社に加わり、Facebook社のより広範な応用機械学習の取り組みの一部となる言語技術グループを設立した。[ 21 ]彼はMultiModal Technologies社[ 22 ]と医療記録を専門とするM*Modalの共同創設者兼取締役を務め、M*Modalは2019年に3M社と合併した。[ 23 ]
2015年には、大学や欧州議会向けに同時通訳サービスを提供するKITES GmbHを共同設立しました。KITESは2021年にZoomに買収され、現在はZoomビデオ会議における自動字幕作成と同時通訳を提供しています。ワイベル氏はZoomのリサーチフェローを務め、関連企業の諮問委員会にも参加しています。
2018年10月、ヴァイベル氏はドイツの名誉毀損法を引用してウィキメディア財団[ 25 ]を相手取った訴訟[ 24 ]に勝訴した。[ 26 ]ウィキペディアの記事の内容が名誉毀損と判断されたのは、主張を裏付けるリンクがアクティブでなくなっていたためであり、これはリンク腐敗と呼ばれる現象である。[ 27 ] [ 28 ]ヴァイベル氏の代理人である法律事務所Raue LLPのプレスリリースによると、ドイツのウィキペディアの記事には、ドイツのメディア ( Mitteldeutscher RundfunkのFAKT ) が報じたように、ヴァイベル氏の研究がアメリカの秘密情報機関と関連しているという誤った主張が含まれていた。[ 25 ]当時、Mitteldeutscher Rundfunk も訴訟を起こしており、自らの報道を堅持していると主張していた。[ 29 ]
アレックス・ワイベルは、 TDNNに関する研究でIEEEシニアベストペーパー賞(1990年)を受賞しました。 1994年には、コンピュータ音声翻訳システムに関する研究でアルカテルSEL 「Forschungspreis Technische Kommunikation」を受賞しました。2002年にはアレン・ニューウェル研究優秀賞を受賞し、2011年にはJibbigo Mobile Translatorsで、モバイルデバイスに音声翻訳機能を提供する優れたモバイル音声翻訳機としてメタ賞を受賞しました。2014年には、 LRECより「人間言語技術における言語資源と言語技術評価の発展への卓越した貢献」によりアントニオ・ザンポリ賞を受賞しました。[ 30 ] InterACTで、2016年に2度目のメタ賞を受賞しました。マルチモーダルインターフェースに関する研究で、ACM-ICMIの持続的功績賞を受賞しました(2019年)。[ 31 ] 2023年、彼は「音声翻訳と支援技術に関する先駆的研究」によりIEEEジェームズ・L・フラナガン音声・音声処理賞を受賞した21人目の受賞者となった。[ 32 ]
ワイベル氏は2017年からIEEEの終身フェロー、国際音声コミュニケーション協会(ISCA)のフェロー、ドイツ国立科学アカデミーレオポルディーナ会員を務めている[ 33 ]。 2023年には、航空探検と深海探査の功績が認められ、エクスプローラーズクラブのフェローに選出された[ 34 ] 。
{{cite book}}:欠落または空|title=(ヘルプ)