Janus認識ツールキット

Janus認識ツールキットJRTk )は、カーネギーメロン大学カールスルーエ工科大学のインタラクティブシステム研究所によって開発・保守されている汎用音声認識ツールキットであり、Janusとも呼ばれています。研究とアプリケーション開発の両方に役立ち、JANUS音声翻訳システムの一部です。[ 1 ]

JRTkは、柔軟なTcl/Tkスクリプトベースの環境を提供します。これにより、研究者は最先端の音声認識装置を構築し、新しい手法を開発、実装、評価することができます。JRTkはオブジェクト指向アプローチを採用しており、他のツールキットとは異なり、ライブラリやコンパイル済みモジュールの集合ではなく、透過的でありながら効率的なオブジェクトを備えたプログラム可能なシェルです。

JRTkバージョン5以降、IBISデコーダーが搭載されています。これは、再入可能な単一発音接頭辞木をベースとし、言語文脈多態性の概念を利用したワンパスデコーダーです。そのため、早い段階で完全な言語知識を組み込むことができます。同じエンジンを統計的n-gram言語モデルと文脈自由文法と組み合わせて使用​​することで、ワンパスでデコードできます。また、このデコーダーを使用して、非常に効率的にラティスを再スコアリングすることも可能です。

JRTkは、音響モデリングに隠れマルコフモデル(HMM)の概念を活用し、音響前処理、音響モデルの学習、音声デコードのための最先端技術を多数提供しています。柔軟なオブジェクト指向アーキテクチャにより、ソースコードの変更や再コンパイルを必要とせずに、すべてのコンポーネント(実行する前処理手順、HMMトポロジー、学習シーケンス、アルゴリズムパラメータ、適応シーケンスなど)を非常に柔軟に設定できます。

JRTk は、次のような音声認識の多くのプロジェクトで Interactive System Labs によって使用されてきました。

参考文献

  1. ^ Sebastian Stüker. 「KIT - Janus Recognition Toolkit」 . Isl.ira.uka.de. 2012年7月19日時点のオリジナルよりアーカイブ。 2012年4月23日閲覧
  2. ^パトリシア・リヒトブラウ (2012-02-01)。「EU-Bridge - ホームページ」。 Eu-bridge.eu 2012 年 4 月 23 日に取得
  3. ^エスベン・エイデヴィク (2012-04-15)。「EVIIL-3D-スタートザイト」。 Eveil-3d.eu 2012 年 4 月 23 日に取得
  4. ^ 「IARPA - 募集 - Office of Incisive Analysis、Babel Program」 Iarpa.gov。2012年4月22日時点のオリジナルよりアーカイブ。 2012年4月23日閲覧
  5. ^ “Bienvenue sur le site de Quaero” . Quaero.org. 2001年5月8日時点のオリジナルよりアーカイブ2012年4月23日閲覧。
  6. ^ 「SFB 588 - ヒューマノイドロボット」 . Sfb588.uni-karlsruhe.de . 2012年4月23日閲覧
  7. ^ 「欧州委員会:CORDIS:プロジェクトと成果サービス:音声翻訳のための技術とコーパス」Cordis.europa.eu . 2016年7月16日閲覧
  8. ^ 「欧州委員会:CORDIS:プロジェクトと成果サービス:多文化交流の促進機関」Cordis.europa.eu . 2016年7月16日閲覧
  9. ^ 「欧州委員会:CORDIS:プロジェクトと成果サービス:電子商取引における話し言葉による交渉」Cordis.europa.eu . 2016年7月16日閲覧