ランゲージウェア

LanguageWareIBMが開発した自然言語処理(NLP)技術で、アプリケーションによる自然言語テキストの処理を可能にします。言語識別、テキスト分割/トークン化、正規化、エンティティと関係の抽出、意味解析と曖昧性解消といった幅広いNLP機能を提供するJavaライブラリ群で構成されています。解析エンジンは複数のレベルで有限状態マシンアプローチを採用しており、これにより、比較的小さなフットプリントを維持しながら、高いパフォーマンス特性を実現しています。

システムの動作は、処理対象言語の特性とドメインを記述する、設定可能な語彙・意味リソースのセットによって制御されます。LanguageWareには、母語の特性(形態論など)と言語の基本語彙を記述するデフォルトのリソースセットが付属しています。また、言語全般に共通するものから、1つ以上のドメインに固有のものまで、追加の語彙、用語、規則、文法を捕捉する補足リソースも作成されています。

EclipseベースのカスタマイズツールであるLanguageWare Resource WorkbenchはIBMのalphaWorks [ 1 ]サイトで公開されており、ドメイン知識をこれらのリソースにコンパイルして分析プロセスに組み込むことができます。

LanguageWare は、 UIMA準拠のアノテーター、Eclipse プラグイン、またはWeb サービスのセットとして展開できます。

参照

参考文献

  1. ^ "alphaWorks コミュニティー" . alphaworks.ibm.com. 2009年10月20日.