Janus認識ツールキット(JRTk )は、カーネギーメロン大学とカールスルーエ工科大学のインタラクティブシステム研究所によって開発・保守されている汎用音声認識ツールキットであり、Janusとも呼ばれています。研究とアプリケーション開発の両方に役立ち、JANUS音声翻訳システムの一部です。[ 1 ]
JRTkは、柔軟なTcl/Tkスクリプトベースの環境を提供します。これにより、研究者は最先端の音声認識装置を構築し、新しい手法を開発、実装、評価することができます。JRTkはオブジェクト指向アプローチを採用しており、他のツールキットとは異なり、ライブラリやコンパイル済みモジュールの集合ではなく、透過的でありながら効率的なオブジェクトを備えたプログラム可能なシェルです。
JRTkバージョン5以降、IBISデコーダーが搭載されています。これは、再入可能な単一発音接頭辞木をベースとし、言語文脈多態性の概念を利用したワンパスデコーダーです。そのため、早い段階で完全な言語知識を組み込むことができます。同じエンジンを統計的n-gram言語モデルと文脈自由文法と組み合わせて使用することで、ワンパスでデコードできます。また、このデコーダーを使用して、非常に効率的にラティスを再スコアリングすることも可能です。
JRTkは、音響モデリングに隠れマルコフモデル(HMM)の概念を活用し、音響前処理、音響モデルの学習、音声デコードのための最先端技術を多数提供しています。柔軟なオブジェクト指向アーキテクチャにより、ソースコードの変更や再コンパイルを必要とせずに、すべてのコンポーネント(実行する前処理手順、HMMトポロジー、学習シーケンス、アルゴリズムパラメータ、適応シーケンスなど)を非常に柔軟に設定できます。
JRTk は、次のような音声認識の多くのプロジェクトで Interactive System Labs によって使用されてきました。