LanguageWareはIBMが開発した自然言語処理(NLP)技術で、アプリケーションによる自然言語テキストの処理を可能にします。言語識別、テキスト分割/トークン化、正規化、エンティティと関係の抽出、意味解析と曖昧性解消といった幅広いNLP機能を提供するJavaライブラリ群で構成されています。解析エンジンは複数のレベルで有限状態マシンアプローチを採用しており、これにより、比較的小さなフットプリントを維持しながら、高いパフォーマンス特性を実現しています。
システムの動作は、処理対象言語の特性とドメインを記述する、設定可能な語彙・意味リソースのセットによって制御されます。LanguageWareには、母語の特性(形態論など)と言語の基本語彙を記述するデフォルトのリソースセットが付属しています。また、言語全般に共通するものから、1つ以上のドメインに固有のものまで、追加の語彙、用語、規則、文法を捕捉する補足リソースも作成されています。
EclipseベースのカスタマイズツールであるLanguageWare Resource WorkbenchはIBMのalphaWorks [1]サイトで公開されており、ドメイン知識をこれらのリソースにコンパイルして分析プロセスに組み込むことができます。
LanguageWare は、 UIMA準拠のアノテーター、Eclipse プラグイン、またはWeb サービスのセットとして展開できます。
参照
参考文献
- ^ "alphaWorks コミュニティ". alphaworks.ibm.com. 2009年10月20日.
外部リンク
- alphaWorks 上の IBM LanguageWare リソース ワークベンチ
- alphaWorks 上の多次元社会意味ネットワーク向け IBM LanguageWare Miner
- IBM.com の IBM LanguageWare 用 JumpStart インフォセンター
- Apache Software Foundation の UIMA ホームページ
- SourceForge の UIMA フレームワーク
- IBM OmniFind Yahoo! Edition (無料エンタープライズ検索エンジン) 2007年2月17日アーカイブ - Wayback Machine
- 意味情報システムおよび言語工学グループ
- セマンティックデスクトップ
関連論文
- Branimir K. Boguraev「大規模NLPアーキテクチャにおける注釈ベースの有限状態処理」、IBMリサーチレポート、2004年
- Alexander Troussov、Mikhail Sogrin、「IBM LanguageWare Ontological Network Miner」
- Sheila Kinsella、Andreas Harth、Alexander Troussov、Mikhail Sogrin、John Judge、Conor Hayes、John G. Breslin、「意味的に有効な人々と関連オブジェクトのネットワークのナビゲーションと注釈付け」
- Mikhail Kotelnikov、Alexander Polonsky、Malte Kiesel、Max Völkel、Heiko Haller、Mikhail Sogrin、Pär Lannerö、Brian Davis、「インタラクティブ セマンティック Wiki」[永久リンク切れ]
- Sebastian Trug、Jos van den Oever、Stéphane Laurière、「ソーシャル セマンティック デスクトップ: Nepomuk」
- Séamus Lawless、Vincent Wade、「動的コンテンツの発見、収集、配信」[リンク切れ]
- R. Mack、S. Mukherjea、A. Soffer、N. Uramoto、E. Brown、A. Coden、J. Cooper、A. Inokuchi、B. Iyer、Y. Mass、H. Matsuzawa、およびLV Subramaniam、「非構造化情報管理アーキテクチャを用いたライフサイエンスのためのテキスト分析」
- Alex Nevidomsky、「IBMにおけるUIMAフレームワークと知識発見」、第4回テキストマイニングシンポジウム、Fraunhofer SCAI、2006年