WebFountainは、 IBMがWorld Wide Web上の非構造化データの研究のために実装したインターネット分析エンジンです。IBMはWebFountainを次のように説明しています。
膨大な量の非構造化および半構造化テキストを収集、保存、分析する一連の研究技術。データから傾向、パターン、関係性を発見することを可能にする、オープンで拡張可能なプラットフォーム上に構築されています。[ 1 ]
このプロジェクトは、Web上の非構造化データを継続的にカタログ化し、解釈する、初の包括的な試みの一つです。この目的のため、IBMの支援研究者は、Web上の情報のサブセットを正確に検索し、リアルタイムのトレンド分析と、Web上で利用可能な情報のメタレベル分析を行うための新たなシステムを研究してきました。
ダウ・ジョーンズとロイター傘下の情報検索会社であるファクティバは、2003年9月にWebFountainのライセンスを取得し、WebFountainエンジンを利用して企業の評判を評価するソフトウェアを開発してきました。[ 2 ] ファクティバは、このサービスの年間サブスクリプションを20万ドルで提供していると報じられています。しかし、ファクティバはその後、他の技術を模索することを決定し、WebFountainとの関係を解消しました。
WebFountain は、カリフォルニア州ベイエリアにあるIBM のアルマデン研究キャンパスで開発されています。
IBMは、非構造化情報の分析に使用できるソフトウェア「UIMA(Unstructured Information Management Architecture)」を開発しました。このソフトウェアは、文書全体の傾向分析、文書のテーマや要点の特定、非構造化文書のあいまい検索などに役立つ可能性があります。[ 3 ]
参考文献
- ^ IBM Redbooks | IBM WebFountainおよびWebFountainアプライアンスの概要( 2011年10月27日Wayback Machineにアーカイブ)
- ^ IBM、Webの理解を深める取り組みを開始 - CNETニュース. News.cnet.com. 2010年10月18日閲覧。
- ^ IBMがWebFountain(UIMA)をオープンソース化Archived 2011-07-07 at the Wayback Machine . IBMがWebFountain(UIMA)をオープンソース化 – 非構造化テキスト分析ソフトウェア。
外部リンク
- IBM アルマデン研究センターWebFountain の概要
- John Battelle の Searchblog におけるWebFountain
- Zdnetの記事「消火栓から水を飲む」
- Cnetの記事( archive.today、2012年7月21日アーカイブ)IBM、Webの理解を深めるべく始動、2004年2月5日
- IBM、パブリックイメージ監視ソリューションのリリースにより企業監視分野に参入、Search Engine Watch、2005年11月9日