トーマス・ファン

中国系アメリカ人のエンジニア、コンピューター科学者(1936年~2020年)
トーマス・ファン
黃煦濤
2000年代初頭の黄
生まれる
トーマス・シータオ・ファン

1936年6月26日1936年6月26日
上海、中華民国
死亡2020年4月25日(2020年4月25日)(享年83歳)
市民権アメリカ人
母校国立台湾大学( BS )
マサチューセッツ工科大学( MS , DSc )
科学者としてのキャリア
フィールドコンピュータサイエンス
機関マサチューセッツ工科大学、
パデュー大学、
イリノイ大学アーバナ・シャンペーン校
論文絵画的ノイズ (1963)
博士課程の指導教員ウィリアム・F・シュライバー

トーマス・シータオ・ホアン繁体字黃煦濤簡体字黄煦涛ピンインHuáng Xùtāo、1936年6月26日 - 2020年4月25日)は、中国生まれの台湾系アメリカ人のコンピュータ科学者、電気技術者である。イリノイ大学アーバナ・シャンペーン校(UIUC)の研究者および名誉教授であった。ホアンは、コンピュータビジョンパターン認識ヒューマンコンピュータインタラクションの分野における第一人者の一人である[1]

幼少期と教育

黄は1936年6月26日、中華民国上海市で生まれました。 [2] 1949年、大逆説の時期に家族は台湾に移住しました。黄は国立台湾大学で電子工学を学び、 1956年に学士号を取得しました。 [3]

黄はマサチューセッツ工科大学(MIT)で学ぶため、米国に渡りました。MITでは、情報理論と画像符号化に関心を持っていたピーター・エリアスと最初に一緒に働き、その後ウィリアム・F・シュライバーと協力しました。当時はスキャナが市販されていなかったため、画像をデジタル化して再現するためのスキャナを作る必要がありました。コンピュータプログラムは、リンカーン研究所のプロトタイプTX-0コンピュータを使用してアセンブリ言語で記述されました。デジタル化された画像の記述は、パンチ穴の開いた紙テープに保存されました[3] 黄は、修士論文「画像統計と線形補間符号化」(1960年)[4]と理学博士論文「画像ノイズ」(1963年)の両方でシュライバーの指導を受けました。[5] 修士論文では、エッジ感度を備えた適応補間技術を用いた画像符号化アルゴリズムに重点が置かれていました。博士論文には、スペクトル全体にわたる画像ノイズの主観的影響に関する研究が含まれています。[3]

キャリア

黄氏はMITの電気工学科の教授に就任し、1963年から1973年までその職に留まりました。[3] 1973年にはパデュー大学 の電気工学教授および情報信号処理研究所の所長に就任し、1980年までその職に留まりました。[3]

1980年、黄氏はイリノイ大学アーバナ・シャンペーン校(UIUC)の電気工学科教授に就任した。 [3] 1996年4月15日、黄氏はUIUCで初代ウィリアム・L・エヴェリット電気・コンピュータ工学特別教授に就任した。[6]彼はコーディネイテッド・サイエンス・ラボラトリー(CSL)に所属し、ベックマン先端科学技術研究所の画像形成・処理グループの責任者、およびベックマン研究所の人間とコンピュータのインテリジェントな相互作用に関する研究トラックの共同議長を務めた。[7] [8] 2012年には、UIUCで最高の寄付講座であるスワンランド教授に任命された。[9] [10]黄氏は2014年12月をもって教職を退いたが、研究者としては引き続き活動している。[11]

黄は、International Journal of Computer Vision, Graphics and Image ProcessingおよびSpringer-VerlagのSpringer Series in Information Sciencesの創刊編集者でした。彼は、第1回国際画像符号化シンポジウム(1969年)、第1回国際超低ビットレートビデオ符号化ワークショップ(1993年)、第1回国際自動顔認識・ジェスチャー認識会議(1995年)の開催に尽力し、これらはすべて後に繰り返し開催されることとなりました。[7]

研究

黄の研究は、マルチモーダルおよびマルチメディア信号処理に広く応用できる一般的な概念、方法論、理論、アルゴリズムの開発に重点を置いていました。[3] MIT在籍中、彼は二重双線形変換とアンセル法に基づいて、2次元フィルタの安定性条件をテストするための最初の代数的手順を開発しました。 [12]彼はまた、デジタルホログラフィーに関する論文を発表しました。[13]パデュー大学在学中、彼は非線形フィルタ、特に画像のノイズ除去の標準的な手法となったメディアンフィルタの研究を行いました。[14]

彼の初期の研究は画像圧縮に関するもので、後に画像強調、復元、解析の分野へと発展しました。彼は2次元スキャン情報を活用したバイナリ文書圧縮手法を開発し、スキャンのある行から次の行への変化を調べ、次の行が異なる遷移点を検出する手法を開発しました。このモデルの性能に関する統計的予測と実験結果はよく一致しました。[3] 1969年、HuangとGrant Andersonは、JJY HuangとPeter M. Schultheissの研究を基に、ブロック変換符号化手法を提案した最初のチームの一つでした。 [15] [17 ]

1984年、ツァイとホアンは、観測された低解像度の衛星画像を取得段階から離散フーリエ変換し、高解像度画像の連続フーリエ変換に関連付け、逆フーリエ変換を用いて解像度を高めた最終画像を得る周波数領域マルチフレーム法を初めて発表した。[18] [19] ホアンは、ウェーブレット符号化法とフラクタル符号化に取り組んいるウェーブレット符号化は、画像、動画、音声、テキストを含むマルチメディアデータベースからコンテンツベースの画像検索を行う上で特に重要である 。これにより、取得したフルサイズの画像ではなく、より小さな符号化画像で検索を行うことができる。[3] その他の重要な研究分野としては、関連性フィードバックを用いてデータベースシステムをユーザーの意図(閲覧時や検索時)に適応させること[20] 、マルチメディア情報(画像シーケンス、音声、および利用可能な場合はクローズドキャプション)を用いて動画の目次や意味索引を作成することなどが挙げられる。[21]

3Dモデリングの分野では、黄は、対応する特徴を識別できる複数の画像から、3次元の動きと剛体構造を識別する研究を行った。[22]この研究は、テレビ画像の圧縮、画像規格の開発、そして人間の視覚とコンピュータビジョンの研究において重要であった。[3]黄はまた、人間の顔、手、体の画像の3Dモデリング、分析、合成にも取り組んだ。この研究の当初の目的は、ビデオ電話や遠隔会議のための低ビットレート3Dモデルベースのビデオコーディングをサポートすることだった。ユーザーの3Dモデルを送信し、受信側で再構成できれば、動き情報を抽出して送信するだけで3Dモデルを駆動し、ビデオシーケンスを再生できるという発想だった。この種のシナリオ向けに開発されたツールは、アバターを使った仮想空間会議や電子ゲームなど、他の多くの問題にも応用できる。[23]

黄氏は画像と音声処理は根本的に類似していると考え[3]、画像だけでなく音声認識と音響処理にも取り組みました。黄氏、マーク・ハセガワ=ジョンソン氏、そして彼らの学生たちは、自動車内で録音された音声のデータベースを作成しました。これは、オーディオビジュアル音声認識アルゴリズムのテストのためのベンチマークとして使用できます。 [24] 彼らはまた、人間の注意を引く可能性のある音声要素を検出する方法も開発し、これを用いて、人間が大量の音声録音をより効果的に分析して重要な情報を見つけられるようにしています。[25]

黄氏は、マルチモーダル・ヒューマン・コンピュータ・インタラクションとインターフェース設計において重要な研究を行った[26]彼は、人間の感情状態を特定するために音声と映像に基づく技術を組み合わせた最初の研究者の一人である。[27]黄氏らによる最近の研究では、「マルチモーダルから最適な方法で情報を抽出するための一連のアルゴリズムの開発」[28]を試みており、複数の情報源から大量のデータを選別し、圧縮・送信されるデータの種類と量を最適化することを目指している。このような機会主義的センシング研究は、軍事用途と民生用途の両方に応用されている。[28] [29]

黄氏はまた、人間が音声やジェスチャーを使ってコンピュータや仮想環境と対話するための、より自然で効果的な方法を開発したいと考えていました。[3]研究プロジェクトには、視覚的な手の追跡ジェスチャー認識[30]音声認識の精度を高めるための視覚的なリップリーディングの使用、仮想環境におけるディスプレイの制御における音声認識と視覚的なジェスチャー分析の統合などが含まれます。[23]

彼はまた、性別、年齢層、感情の視聴覚認識に関する研究も行いました。彼の性別と感情の検出に関する研究は、彼のソフトウェアがモナ・リザの分析に使用され、その肖像画は女性(一部の説とは異なり、ダ・ヴィンチ自身をモデルにしたものではない)であり、彼女の謎めいた微笑みは悲しみよりも喜びに満ちていると結論づけられたことで、メディアの注目を集めました。[31] [32]

2015年、黄氏はアン・ウィレムセン・ダンラップ氏と共同で、患者への医療情報のオンラインコミュニケーションに使用するための適切な感情を表現できる3Dコンピューター生成アバターを開発する学際的なプロジェクトに取り組みました。[33]

彼はまた、高性能コンピューティングビッグデータを活用し、ディープラーニングのより優れた技術の開発にも取り組んでいました[11]研究対象の一つは、当然のことながら顔認識です。別のプロジェクトでは、彼のチームは天文学者のロバート・ブルナーと共同で、銀河の画像を識別するためのフィードフォワードニューラルネットワークの訓練を行っています[34]

出版作品

2010年現在、[アップデート]黄氏は21冊以上の著書を出版し、600本以上の論文を執筆している。[35]トーマス・黄氏の代表的な出版物は以下の通りである。

  • Qi, GJ、Aggarwal, C.、Tian, Q.、Ji, H.、Huang, TS (2012)、「ソーシャルメディアにおけるコンテキストとコンテンツリンクの探索:潜在空間法」、IEEE Transactions on Pattern Analysis and Machine Intelligence、pp. 850–862。
  • Jaimes, A.、Gatica-Perez, D.、Sebe, N.、Huang, TS (2007)、「人間中心のコンピューティング: 人間革命に向けて」、IEEE Computer、40(5)、30 ~ 34 ページ。
  • Cohen, I., Cozman, F., Sebe, N., Cirelo, M., Huang, TS (2004)「分類子の半教師あり学習:理論、アルゴリズム、および人間とコンピュータの相互作用への応用」、IEEE Transactions on Pattern Analysis and Machine Intelligence、26(12)、pp. 1553–1567。
  • Pan, H., Levinson, SE, Huang, TS、および Liang, ZP (2004)、「バイモーダル音声処理への応用を伴う融合 HMM モデル」、IEEE Transactions On Signal Processing、52/3、pp. 573– 581。
  • Zhou, XS、Huang, TS (2003)、「画像検索における関連性フィードバック: 包括的なレビュー」、ACM Multimedia Systems Journal、pp. 536–544。
  • Bruckstein, AM、Holt, RJ、Huang, TS、およびNetravali, AN (2000)、「3D ポーズ推定のための新しいデバイス: カマキリの目、アガムの絵画、日時計、およびその他の空間基準」、International Journal of Computer Vision、pp. 131–139。
  • Rui, Yong; Huang, Thomas S.; Chang, Shih-Fu (1999). 「画像検索:現在の技術、有望な方向性、そして未解決の課題」(PDF) . Journal of Visual Communication and Image Representation . 10 : 39– 62. CiteSeerX  10.1.1.32.7819 . doi :10.1006/jvci.1999.0413. S2CID  2910032. 2015年7月23日閲覧.– この論文は、2010年にJournal of Visual Communication and Image Representationから10年間で最も引用された論文賞を受賞した[35]。
  • Lew, MS、Wong, K.、および Huang, TS (1994)、「ステレオマッチングにおける学習と特徴選択」、IEEE Transactions on Pattern Analysis and Machine Intelligence、pp. 869–881。
  • Arun, K.、Huang, TS、およびBlostein, SD (1987)、「2つの3Dポイントセットの最小二乗フィッティング」、IEEE Transactions on Pattern Analysis and Machine Intelligence、pp. 698–700。
  • RY Tsai と TS Huang、(1984)「曲面を持つ剛体の 3 次元運動パラメータの一意性と推定」IEEE Transactions on Pattern Analysis and Machine Intelligence、pp. 13–27。

私生活

黄氏はマーガレット氏と結婚していたが、彼女は黄氏より3ヶ月早く亡くなった。二人は1959年に結婚した。[36]

黄氏は2020年4月25日にインディアナ州で83歳で安らかに亡くなった。[37]

夫婦にはキャロライン、グレッグ、トム、マージョリーの4人の子供がいた。[36]

栄誉

黄氏はそのキャリアの中で数々の栄誉と賞を受賞した。[38]

会員資格

受賞歴

受賞歴

黄氏は100名以上の大学院生を指導しました。2012年には、元学生のジェームズ・J・クック氏とチャン・ウェン・チェン氏の呼びかけに応えて、黄氏夫妻の指導者および教育者としての貢献、そして研究者としての貢献を称えるため、トーマス・アンド・マーガレット・黄大学院研究基金が設立されました。この基金は、ベックマン研究所でヒューマン・コンピュータ・インテリジェント・インタラクションを専攻する学生を支援するための奨学金を提供します。[50] [51]

参考文献

  1. ^ Bovik, Alan C.; Chen, Chang Wen; Goldgof, Dmitry (2002). Bovik, Alan C.; Chen, Chang Wen; Goldgof, Dmitry (編).画像処理と理解の進歩:Thomas S. Huang記念論文集. 機械知覚と人工知能シリーズ. 第52巻. シンガポール: World Scientific. doi :10.1142/5042. ISBN 978-981-238-091-3
  2. ^ 会長および会計担当者の報告書。ジョン・サイモン・グッゲンハイム記念財団。1971年、56ページ。
  3. ^ abcdefghijkl Goldstein, Andrew (1997年3月20日). 「THOMAS HUANG: An Interview Conducted by Andrew Goldstein (Interview #331 for the Center for the History of Electrical Engineering)」. Center for the History of Electrical Engineering . ホーボーケン、ニュージャージー州: The Institute of Electrical and Electronics Engineers, Inc. 2015年7月22日閲覧
  4. ^ Huang, Thomas Shi-Tao (1960).画像統計と線形補間符号化(修士論文編). マサチューセッツ州ケンブリッジ:マサチューセッツ工科大学、電気工学部.
  5. ^ Huang, Thomas Shi-Tao (1963).絵画的ノイズ(理学博士論文編集). マサチューセッツ州ケンブリッジ:マサチューセッツ工科大学、電気工学部.
  6. ^ 「教授職:ウィリアム・L・エヴェリット電気工学教授」ECEイリノイ、イリノイ大学、1996年。 2015年7月23日閲覧
  7. ^ ab Xiong, Ziyou; Radhakrishnan, Regunathan; Divakaran, Ajay; Rui, Yong; Huang, Thomas S. (2006). 「著者紹介」.消費者向けおよび監視ビデオへの応用を含むビデオ要約、閲覧、検索のための統合フレームワーク. アムステルダム: Elsevier/Academic Press. pp.  263– 264. ISBN 978-0-12-369387-7
  8. ^ 「ベックマン研究所ディレクトリ:トーマス・S・フアン」。ベックマン先端科学技術研究所。 2010年5月28日閲覧
  9. ^ 「5人の教授がスワンランド教授職に任命される」The News-Gazette 2012年12月5日. 2015年7月23日閲覧
  10. ^ 「議長:スワンランド議長」ECEイリノイ. 2015年7月23日閲覧
  11. ^ ab Valentine, Ashish (2014年12月5日). 「Loui, Huang, and Polychronopoulos retire from teaching at ECE Illinois」ECE Illinois . 2015年7月27日閲覧
  12. ^ Huang, T. (1972年6月). 「2次元再帰フィルタの安定性」. IEEE Transactions on Audio and Electroacoustics . 20 (2): 158– 163. doi :10.1109/TAU.1972.1162364.
  13. ^ Huang, TS (1971). 「デジタルホログラフィー」. Proceedings of the IEEE . 59 (9): 1335– 1346. doi :10.1109/PROC.1971.8408.
  14. ^ Huang, T.; Yang, G.; Tang, G. (1979). 「高速2次元メディアンフィルタリングアルゴリズム」. IEEE Transactions on Acoustics, Speech, and Signal Processing . 27 (1): 13– 18. doi :10.1109/tassp.1979.1163188.
  15. ^ アンダーソン、グラント、フアン、トーマス・S. (1971). 「区分的フーリエ変換による画像帯域幅圧縮」. IEEE Transactions on Communications . 19 (2): 133– 140. doi :10.1109/tcom.1971.1090630.この論文の初期版は、1969年4月28日から30日に開催されたパデュー大学創立100周年記念システム・情報科学シンポジウムの議事録に掲載されました。
  16. ^ Huang, JJY; Schultheiss, Peter M. (1963). 「相関ガウス確率変数のブロック量子化」. IEEE Transactions on Communications Systems . 11 (3): 289– 296. doi :10.1109/tcom.1963.1088759.
  17. ^ Nebeker, Frederik (1998). 「デジタル化:1960年代」(PDF) .信号処理:分野の出現、1948-1998 . ピスカタウェイ、ニュージャージー州:IEEEプレス. pp.  55– 87. 2015年7月25日時点のオリジナル(PDF)からアーカイブ。 2015年7月24日閲覧
  18. ^ Tsai, R.; Huang, T. (1984). 「マルチフレーム画像の復元とレジストレーション」.コンピュータビジョンと画像処理の進歩. JAI Press Inc. pp.  317– 339.
  19. ^ 高度な画像およびビデオ解像度向上技術、Quang H. Luong
  20. ^ Zhou, Xiang Sean; Huang, Thomas S. (2003年4月1日). 「画像検索における関連性フィードバック:包括的レビュー」.マルチメディアシステム. 8 (6): 536– 544. CiteSeerX 10.1.1.89.8025 . doi :10.1007/s00530-002-0070-3. S2CID  9664339. 
  21. ^ Xiong, Ziyou; Radhakrishnan, Regunathan; Divakaran, Ajay; Rui, Yong; Huang, Thomas S. (2006).消費者向けおよび監視ビデオへの応用を含むビデオ要約、閲覧、検索のための統合フレームワークアムステルダム: Elsevier/Academic Press. ISBN 978-0-12-369387-7
  22. ^ Huang, TS; Netravali, AN (2002). 「特徴の対応関係からの動きと構造:レビュー」. Proceedings of the IEEE . 82 (2): 252– 268. doi :10.1109/5.265351.
  23. ^ ab Wen, Zhen; Huang, Thomas S. (2004). 3D顔処理:モデリング、分析、合成. ボストン: Kluwer Academic Publishers. ISBN 978-1402080470
  24. ^ Lee, B.; Hasegawa-Johnson, M.; Goudeseune, C.; Kamdar, S.; Borys, S.; Liu, M.; Huang, TS (2004). AVICAR: 車内環境における視聴覚音声コーパス. INTERSPEECH: ISCA.
  25. ^ ディキンソン、メグ. 「研究によって、どのような音が注目を集めるのか、そしてそれをどのように特定するのかが明らかになる」ECEイリノイ. 2014年2月17日号. 2015年7月27日閲覧
  26. ^ Sharma, R.; Pavlovic, VI; Huang, TS (1998年5月). 「マルチモーダル・ヒューマン・コンピュータ・インターフェースに向けて」. Proceedings of the IEEE . 86 (5): 853– 869. doi :10.1109/5.664275.
  27. ^ Huang, Thomas S.; Chen, Lawrence S.; Tao, Hai (1998年4月). 「人間と機械によるバイモーダル感情認識」. ATR仮想コミュニケーション環境ワークショップ論文集.
  28. ^ ab Kelly, Megan (2009年12月14日). 「ECEの教員、機会主義的センシングの研究のため国防総省から150万ドルの助成金を受ける」ECE Illinois . 2015年7月27日閲覧
  29. ^ Dahlquist, April (2011年8月8日). 「数学 vs. 野生:研究者はコンピュータービジョンを使って野生生物を識別」ECE Illinois . 2015年7月27日閲覧
  30. ^ Pavlovic, VI; Sharma, R.; Huang, TS (1997年7月). 「人間とコンピュータのインタラクションにおけるハンドジェスチャーの視覚的解釈:レビュー」. IEEE Transactions on Pattern Analysis and Machine Intelligence . 19 (7): 677– 695. CiteSeerX 10.1.1.353.4090 . doi :10.1109/34.598226. S2CID  7185733. 
  31. ^ グレッグ・クライン(2006年3月6日)「ソフトウェアはモナ・リザが人間でもダ・ヴィンチでもないことを示す」The News-Gazette 。 2015年7月27日閲覧
  32. ^ イリノイ大学ベックマン研究所 (2005). 「研究プロフィール:トーマス・フアン」(PDF) . 2005-06年度年次報告書. イリノイ大学アーバナ・シャンペーン校. pp.  18– 19.
  33. ^ 「Jump ARCHESがHuangの3Dアバタープロジェクトに資金提供」CSL: Coordinated Science Lab, ECE Illinois. 2015年2月24日. 2015年7月23日閲覧
  34. ^ クーン、マイク(2014年11月11日)「スーパーコンピューティングがディープニューラルネットワークの進歩を加速」イリノイ州エンジニアリング・コミュニケーションズ・オフィス。 2015年7月27日閲覧
  35. ^ ab 「黄氏が10年間で最も引用された論文賞を受賞」ベックマン研究所2010年6月30日。
  36. ^ ab 「COVID-19の時代に両親を亡くしました。どうすれば自分の人生を取り戻せるでしょうか?」 -ボストン・グローブ、2020年5月14日
  37. ^ コミュニケーションズ、グレインジャーエンジニアリングマーケティングオフィス。「電気・コンピュータ工学の名誉教授、メイベル・リーランド・スワンランド寄付講座教授、トーマス・フアンを偲んで」ece.illinois.edu 。 2021年6月14日閲覧
  38. ^ "Thomas S. Huang". ECE Illinois, Department of Electrical and Computer Engineering. 2011年10月6日時点のオリジナルよりアーカイブ。 2010年5月28日閲覧
  39. ^ “Thomas S. Huang”. 中央研究院. 2023年9月16日閲覧
  40. ^ 「2009年中国科学院外国人会員名簿(姓別)」.中国科学院. 2015年7月23日閲覧
  41. ^ 「全米工学アカデミー、会員74名と外国人会員8名を選出」全米工学アカデミーニュース2001年2月16日. 2015年7月23日閲覧
  42. ^ 「Dr. Thomas S. Huang」.米国工学アカデミー. 2015年7月23日閲覧
  43. ^ 「IEEEフェロー1979 | IEEE通信協会」。
  44. ^ Gudeman, Kim (2009年6月16日). 「3人のCSL研究者がHP Labs Innovation Research Awardsを受賞」. CSL: Coordinated Science Laboratory . 2015年7月23日閲覧
  45. ^ 「黄氏がEIの年間最優秀科学者に選出」ベックマン研究所2006年2月3日. 2015年7月23日閲覧
  46. ^ 「大川賞」.大川情報通信財団. 2015年7月23日閲覧
  47. ^ 「IAPR Awards: The King-Sun Fu Prize」.国際パターン認識協会 (IAPR) . 2015年7月23日閲覧
  48. ^ 「IEEE Jack S. Kilby信号処理メダル受賞者」(PDF) IEEE . 2010年6月19日時点のオリジナル(PDF)からアーカイブ。2011年2月27日閲覧
  49. ^ 「IEEE Jack S. Kilby信号処理メダル受賞者 – 2001 – Thomas S. HuangとArun N. Netravali」IEEE。2010年4月8日時点のオリジナルよりアーカイブ2011年2月27日閲覧。
  50. ^ McGaughey, Steve (2012年1月8日). 「Huang FundとChallengeはBeckman Originalへのトリビュート」. Beckman Institute .
  51. ^ 「トーマス・アンド・マーガレット・フアン大学院研究基金」ベックマン研究所。 2015年7月23日閲覧
「https://en.wikipedia.org/w/index.php?title=Thomas_Huang&oldid=1327016158」より取得