UIMA(/ j u ˈ iː m ə / yoo- EE -mə)[1]は、非構造化情報管理アーキテクチャの略で、コンテンツ分析 のためのOASIS標準[2]であり、元々はIBMで開発されました。UIMAは、非構造化情報の分析と検索技術との統合のためのマルチモーダル分析の開発、発見、構成、展開のためのコンポーネントソフトウェアアーキテクチャを提供します。
構造
UIMA アーキテクチャは、次の 4 つの次元で考えることができます。
- 分析パイプライン内のコンポーネント インターフェイスを指定します。
- 一連のデザインパターンを記述します。
- これは、高性能分析のための注釈のインメモリ表現と、リモート Web サービスとの統合のための注釈のXML表現という 2 つのデータ表現を提案します。
- 多様なスキルを持つユーザーがツールを利用できるようにする開発ロールを提案します。
実装と使用
| アパッチUIMA | |
|---|---|
| 開発者 | IBM、Apache Software Foundation(2006年10月以降) |
| 安定版リリース | 3.1.1 / 2019年11月8日[3] ( 2019-11-08 ) |
| リポジトリ |
|
| 書かれた | C ++対応Java |
| オペレーティング·システム | クロスプラットフォーム |
| タイプ | テキストマイニング、情報抽出 |
| ライセンス | Apacheライセンス2.0 |
| Webサイト | uima.apache.org |
UIMA のリファレンス実装であるApache UIMA は、Apache Software Foundationによって管理されています。
UIMA は、数多くのソフトウェア プロジェクトで使用されています。
- IBM ResearchのWatsonは非構造化データの分析にUIMAを使用しています。[4]
- 臨床テキスト分析および知識抽出システム ( Apache cTAKES ) は、医療記録から情報を抽出するための UIMA ベースのシステムです。
- DKPro Coreは、汎用自然言語処理用の再利用可能な UIMA コンポーネントのコレクションです。
参照
参考文献
- ^ UIMA よくある質問 (FAQ) [永久リンク切れ] Apache Software Foundation
- ^ UIMA 仕様 Apache ソフトウェア財団。
- ^ “Apache UIMA - ニュース”. uima.apache.org 。2019 年12 月 11 日に取得。
- ^ 「ApacheのイノベーションがIBMの『地球上で最も賢いマシン』をJeopardy!クイズ番組初の人間対機械対決で強化:Apacheソフトウェア財団ブログ」blogs.apache.org 2011年2月14日2018年4月23日閲覧。
外部リンク
- Apache UIMA ホームページ