オープンマインド・コモンセンス

Open Mind Common SenseOMCS)は、マサチューセッツ工科大学(MIT)メディアラボを拠点とする人工知能プロジェクトです。その目標は、Web上の何千人もの人々の貢献から得られる大規模な常識知識ベースを構築し、活用することです。1999年から2016年まで活動してきました。

設立以来、15,000人以上の貢献者から100万件以上の英語の事実に加え、他言語の知識ベースも蓄積してきました。OMCSのソフトウェアの多くは、3つの相互接続された表現に基づいています。すなわち、人々が直接対話する自然言語コーパス、このコーパスから構築されたConceptNetと呼ばれる意味ネットワーク、そして次元削減を用いて新しい知識を推論できるConceptNetの行列ベースの表現であるAnalogySpaceです。[ 1 ] Open Mind Common Senseによって収集された知識は、MITをはじめとする様々な研究プロジェクトを可能にしてきました。

歴史

このプロジェクトは、マービン・ミンスキー、プッシュ・シン、キャサリン・ハヴァシらの発案によるものです。開発作業は1999年9月に開始され、1年後にはインターネット上に公開されました。ハヴァシは博士論文の中で、このプロジェクトを「インターネットの分散型人間計算能力の一部を活用する試みであり、当時はまだ初期段階にあったアイデアであった」と述べています。[ 2 ]オリジナルのOMCSは、ウェブサイトEverything2とその前身から影響を受けており、 Googleに触発されたミニマルなインターフェースを備えています。

プッシュ・シンは2007年にMITメディアラボの教授となり、コモンセンス・コンピューティング・グループを率いる予定だったが、2006年2月28日に自殺した。[ 3 ]

このプロジェクトは現在、キャサリン・ハヴァシ率いるMITメディアラボのデジタル・インチュイション・グループによって運営されています。

データベースとウェブサイト

OMCSには、多種多様な知識が含まれています。いくつかの文は、オブジェクトやイベント間の関係性を自然言語の簡単なフレーズで表現します。例えば、「コートは暖をとるために使われる」「太陽はとても暑い」「夕食を作るときに最後にすることは皿を洗うことだ」などです。データベースには、状況の感情的な内容に関する情報も含まれています。例えば、「友達と過ごす時間は幸せをもたらす」「交通事故に遭うと怒りを感じる」などです。OMCSには、「人々は尊敬されたい」「人々はおいしいコーヒーを飲みたい」など、大小さまざまな人々の欲求や目標に関する情報も含まれています。[ 1 ]

当初、これらの記述は制約のないテキスト文としてウェブサイトに入力することができ、後から解析する必要がありました。現在のバージョンのウェブサイトでは、より構造化された空欄補充型のテンプレートのみを使用して知識を収集しています。OMCSは、Game With a PurposeのVerbosity」によって収集されたデータも利用しています。[ 4 ]

OMCSデータベースは、本来の形で言えば、共通の知識を伝える短い文の集合体にすぎません。この知識を計算的に利用するには、より構造化された表現に変換する必要があります。

コンセプトネット

ConceptNetは、 OMCSデータベースの情報に基づく意味ネットワークです。ConceptNetは有向グラフとして表現され、ノードは概念、エッジはそれらの概念に関する常識的な主張です。概念は、名詞句、動詞句、形容詞句、節など、密接に関連する自然言語句の集合を表します。[ 5 ]

ConceptNetは、OMCSの自然言語アサーションを、浅いパーサーを用いてパターンと照合することで作成されます。アサーションは、限られた関係集合から選択された2つの概念間の関係として表現されます。これらの様々な関係は、OMCSコーパスに見られる一般的な文型を表しており、特に、知識収集ウェブサイトで使用されるすべての「空欄補充」テンプレートは、特定の関係に関連付けられています。[ 5 ]

ConceptNetを構成するデータ構造は2007年に大幅に再編成され、ConceptNet 3として公開されました。[ 5 ]ソフトウェアエージェントグループは現在、新しいバージョン4.0用のデータベースとAPIを配布しています。[ 6 ]

2010年、OMCSの共同設立者兼ディレクターのキャサリン・ハヴァシは、ロビン・スピア、デニス・クラーク、ジェイソン・アロンソとともに、ConceptNetを基盤としたテキスト分析ソフトウェア会社であるLuminosoを設立した。 [ 7 ] [ 8 ] [ 9 ] [ 10 ]同社はConceptNetを主要な語彙リソースとして使用し、企業がアンケート、製品レビュー、ソーシャルメディアなどの膨大な量の定性データを理解し、洞察を引き出すことを支援している。[ 7 ] [ 11 ] [ 12 ]

機械学習ツール

ConceptNetの情報は、機械学習アルゴリズムの基礎として利用できます。AnalogySpaceと呼ばれる表現手法は、特異値分解を用いてConceptNetの知識パターンを一般化し、AIアプリケーションで利用可能な方法で表現します。開発者は、テキストコーパス、ConceptNetのような構造化知識ベース、そしてその両方に 基づく機械学習を実行するためのPython機械学習ツールキットDivisi [ 13 ]を配布しています。

他のプロジェクトとの比較

その他の同様のプロジェクトには、Never-Ending Language LearningMindpixel(廃止)、Cyc、Learner、SenticNet、FreebaseYAGODBpedia、Open Mind 1001 Questionsなどがあり、知識を収集し、参加のインセンティブを提供するための代替アプローチを模索してきました。

Open Mind Common Senseプロジェクトは、Cycとは異なり、収集した常識的な知識を形式的な論理構造ではなく、英語の文章として表現することに重点を置いています。ConceptNetは、その開発者の一人であるHugo Liu氏によって、 「形式的な言語的厳密さよりも非形式的な概念的つながりを重視している」ため、CycよりもWordNetに似た構造になっていると説明されています。[ 14 ]

参照

参考文献

  1. ^ a b Robyn Speer、Catherine Havasi、Henry Lieberman. AnalogySpace: 常識的知識の次元削減Archived 2010-07-09 at the Wayback Machine . AAAI 2008.
  2. ^キャサリン・ハヴァシ. 特異値分解に基づく手法を用いた意味関係の発見. ブランダイス大学博士論文, 2009年6月.
  3. ^ MITニュースオフィス (2006年3月8日). 「プシュピンダー・シンの追悼式は明日予定」 . MITテックトーク. 2009年10月7日閲覧。
  4. ^ 「冗長性に関するプロファイル」。Open Mind Commons Sense。 2010年6月25日時点のオリジナルよりアーカイブ。
  5. ^ a b cキャサリン・ハヴァシ、ロビン・スピア、ジェイソン・アロンソ。ConceptNet 3:常識的知識のための柔軟で多言語的なセマンティックネットワーク。自然言語処理における最近の進歩に関する議事録、2007年。ConceptNet 3:... を試してみる(Wayback Machineで2015年5月29日にアーカイブ)
  6. ^ Commonsense Computing Initiative (2009年2月24日). 「LaunchpadのConceptNet API」 . 2009年10月7日閲覧
  7. ^ a bローア、スティーブ(2014年6月27日)「ソーシャルメディアを通して見る米独対戦」ニューヨーク・タイムズ2015年3月3日閲覧
  8. ^ Rusli, Evelyn (2014年4月14日). 「企業は人工知能を活用して買い物客の意見を掘り起こす」 . ウォール・ストリート・ジャーナル. 2015年3月3日閲覧
  9. ^ Alba, Davey (2015年2月12日). 「Twitterのチャットをリアルタイムで分析できるスタートアップ」 . Wired . 2015年3月3日閲覧
  10. ^ Noyes, Katherine (2015年2月11日). 「Luminosoから企業へ:その噂の真意とは?」 PC World . 2015年3月3日閲覧
  11. ^ Miller, Ron (2014年7月2日). 「Luminoso、クラウドテキスト分析サービスの構築を継続するためシリーズAで650万ドルを調達」 TechCrunch . 2015年3月3日閲覧
  12. ^ Darrow, Barb (2015年2月11日). 「Luminoso、ストリーミングデータにテキスト分析のスマート機能を提供」 . GigaOm. 2015年3月10日時点のオリジナルよりアーカイブ。 2015年3月3日閲覧
  13. ^ Commonsense Computing Initiative (2009年2月24日). 「Divisi in Launchpad」 . 2009年10月7日閲覧
  14. ^ 「The ConceptNet Project V2.1」 。 2008年12月17日閲覧