ESPゲーム(超感覚知覚ゲーム)は、複雑なメタデータの作成という問題に対処するために開発された、人間ベースの計算ゲームです。このゲームの背景にあるアイデアは、コンピュータでは不可能なタスク(元々は画像認識)を人間の計算能力を用いてゲームとしてパッケージ化することで実現するというものです。このゲームはカーネギーメロン大学のルイス・フォン・アンによって考案され、2003年に初めてオンラインで公開されました。[ 1 ]
公式サイトでは、ローンチ時に「ESPゲームが他の人気オンラインゲームと同じくらいプレイされれば、数週間でウェブ上のすべての画像にラベルを付けることができると推定しています!」と述べていました。[ 2 ]オリジナルの論文(2004年)では、2人のプレイヤーが1分間に3.89 ± 0.69個のラベルを生成できると報告されています。このペースで、5,000人が継続的にゲームをプレイすると、Googleにインデックスされている画像(4億2,500万枚)ごとに31日間で1個のラベルが生成されることになります。[ 1 ] 2003年10月のサイトローンチから2008年5月までに、3,600万個のラベルが収集されました。[ 3 ]
2008年後半、このゲームは新しいユーザーインターフェースを備え、 GWAP(「目的を持ったゲーム」)としてブランド名が変更されました。ルイス・フォン・アンが制作した他のゲーム、「ピーカブーム」や「フェッチ」などは、この時点で開発が中止されました。「ピーカブーム」は、ESPゲームを拡張し、プレイヤーにラベルに対応する画像領域を選択させます。「スクイグル」は、プレイヤーに画像内の物体の輪郭をトレースさせます。「マッチン」は、2つの画像のうち、より美しい方を選びます。[ 4 ]「バーボシティ」は、プレイヤーから常識的な事実を収集します。[ 5 ]
Googleは2006年、オンライン画像検索の精度向上を目的として、このゲームの独自バージョン(Google Image Labeler )を作成するライセンスを取得した。 [ 6 ] AhnのESPゲーム(Google版)によって取得されたデータのライセンスは明確ではない。Google版は、2011年9月のGoogle Labs閉鎖に伴い、2011年9月16日に終了した。
ESPデータセットの大部分は公開されていません。ImageNetの論文によると、2008年時点では6万枚の画像とそのラベルのみがアクセス可能でした。[ 7 ]
コンセプト
画像認識は、歴史的にコンピュータが単独で実行するのが困難なタスクでした。人間は画像認識を完璧に実行できるものの、必ずしも積極的に行うとは限りません。認識タスクを「ゲーム」にすることで、人々が参加する可能性が高まります。ゲームをどれだけ楽しんだかを尋ねたところ、ユーザーから収集されたデータは非常に肯定的なものでした。
多数のラベル付き画像を持つことの応用と利用法は重要です。例えば、画像のラベルを読み上げることで、画像検索の精度が向上し、視覚障碍者にとってアクセシビリティが向上します。2人で協力して画像にラベルを付けることで、入力された単語の正確性が向上します。2人の共通点は同じ画像を見ていることだけなので、ラベルが一致する可能性を高めるには、妥当なラベルを入力する必要があります。
現在実装されているESPゲームでは、プレイヤーは「明白な」ラベル、つまり相手との合意に最もつながりやすいラベルを割り当てるように促されます。しかし、これらのラベルは多くの場合、適切な言語モデルを用いて既存のラベルから推測できるため、システムに追加される情報はごくわずかです。Microsoftの研究プロジェクトでは、次に追加されるラベルに確率を割り当てています。このモデルは、画像を見ずにESPゲームをプレイするプログラムで使用されています。[ 8 ]
ESPゲームの作者らは、ゲームを用いて生成されたラベルが実際に画像の有用な説明であるという証拠を提示しました。ランダムに選択されたキーワードを検索した結果が提示され、ゲームによって生成されたラベルを用いて検索した場合、適切な画像の割合が非常に高いことが示されました。さらに、ゲームによって生成されたラベルと、画像の説明を求められた参加者が生成したラベルを比較することで、さらなる評価が行われました。
ゲームのルール
ログインすると、ユーザーは自動的にランダムに選ばれたパートナーとマッチングされます。パートナーは互いの身元を知らず、コミュニケーションも取れません。マッチングが完了すると、両者に同じ画像が表示されます。二人の課題は、画像に適切なラベルとなる単語を決めることです。二人とも候補となる単語を入力し、二人とも(必ずしも同時にではありません)単語を入力すると、その単語が承認され、画像のラベルとなります。単語が承認されると、別の画像が表示されます。二人は2分半で15枚の画像にラベルを付けます。
どちらのパートナーにもパス、つまり画像を諦める選択肢があります。片方のパートナーがパスすると、もう片方のパートナーにパスを希望するメッセージが表示されます。新しい画像を表示するには、両方のパートナーがパスする必要があります。
一部の画像には「タブー」ワード、つまりラベルとして入力できない単語が含まれています。これらの単語は通常、画像に関連しており、一般的な単語でラベルを付けることを妨げるため、ゲームの難易度を下げます。タブーワードはゲーム自体から取得されます。画像がゲームで初めて使用されるときは、タブーワードは設定されていません。同じ画像が再び使用されるときは、前回の合意に基づいて設定された単語が1つ設定されます。次に同じ画像が使用されるときは、タブーワードが2つ設定され、これが繰り返されます。「タブーワード」の設定はシステムによって自動的に行われます。画像に同じ単語が何度もラベル付けされると、その単語はタブーとなり、異なる単語がラベルとして設定されるようになります。
時折、このゲームは人間のパートナーなしで一人でプレイされることがあります。その場合、ESPゲーム自体が対戦相手となり、一人の人間プレイヤーに事前に決められたラベル(これらのラベルは、実際の人間が以前にプレイしたゲーム中に画像に付与されたラベルから抽出されたものです)を提示します。これは、奇数人のプレイヤーがゲームをプレイする場合に必要です。[ 9 ]
このゲームは目的を持ったソーシャルマシン(目的論的ソーシャルマシン)の重要な例として使用され、ネロ・クリスティアニーニの著書「ショートカット」 [ 10 ]で、人間の参加者の相互作用から出現するインテリジェントシステムの例として提供され、ソーシャルメディアプラットフォームのインテリジェンスが議論されています。
不正行為
アンは、プレイヤーがゲームを「不正行為」し、システムに虚偽のデータを導入するのを防ぐ対策を説明した。共通のラベルが既知のテスト画像をプレイヤーに時折与えることで、プレイヤーが正直に回答していることを確認でき、プレイヤーの推測はテスト画像に正しくラベル付けできた場合にのみ保存される。[ 9 ]
さらに、ラベルは一定数のプレイヤー(N)が合意した後にのみ保存されます。この時点で、画像のタブー語は削除され、画像は新しい画像のようにゲームプールに戻されます。プレイヤーがテスト画像に正しくラベル付けしたにもかかわらず、ラベルが誤っている確率をXとすると、N回の繰り返し後、ラベルが破損する確率は、繰り返し回数が互いに独立していると仮定すると、Xとなります。[ 9 ]
画像の選択
ESPゲームで使用される画像の選択は、プレイヤーの体験に大きな違いをもたらします。もしすべての画像が単一のサイトから選ばれ、非常に似たものばかりだったとしたら、ゲームの面白さは半減してしまうでしょう。
ESPゲームの最初の実行では、開発者が選んだ35万枚の画像コレクションが使用されました。その後のバージョンでは、少量のフィルタリングを施し、ウェブからランダムに画像が選択されました。これらの画像は、完全にラベル付けされるまで、ゲームに複数回再導入されます。[ 9 ]ランダム画像は、「Random Bounce Me」というウェブサイトを使用して選択されました。これは、Googleデータベースからページをランダムに選択するウェブサイトです。「Random Bounce Me」は繰り返しクエリを実行し、そのたびにランダムページ内のすべてのJPEGおよびGIF画像を収集しました。ただし、基準に当てはまらない画像は除外されました。基準とは、空白画像、単色画像、縦横比が4.5より大きいか1/4.5より小さい画像です。このプロセスは、35万枚の画像が収集されるまで繰り返されました。その後、画像はゲームの表示に合わせて再スケーリングされました。ゲームの各セッションでは、35万枚の画像から15枚の異なる画像が選択されます。
参考文献
- ^ a b von Ahn, Luis; Dabbish, Laura (2004-04-25). 「コンピュータゲームによる画像のラベル付け」 . SIGCHI ヒューマンファクターズ・イン・コンピューティングシステム会議論文集. ACM. pp. 319– 326. doi : 10.1145/985692.985733 . ISBN 978-1-58113-702-6。
- ^ 「ESPゲームプロジェクト」 2003年10月20日. 2003年10月20日時点のオリジナルよりアーカイブ。2024年11月13日閲覧。
- ^ 「ESPゲームプロジェクト」 2008年5月9日. 2008年5月9日時点のオリジナルよりアーカイブ。2024年11月13日閲覧。
- ^ 「Webの画像問題を解決する」 2008年5月14日。 2024年11月13日閲覧。
- ^フォン・アン、ルイス、ケディア、マヌエル・ブルム (2006年4月22日). 「Verbosity: 常識的な事実を集めるゲーム」 . SIGCHI ヒューマンファクターズ・イン・コンピューティングシステム会議論文集. ACM. pp. 75– 78. doi : 10.1145/1124772.1124784 . ISBN 978-1-59593-372-0。
- ^ 「ウェブの画像問題を解決する」 BBC、2008年5月14日。 2008年12月14日閲覧。
- ^ Deng, Jia; Dong, Wei; Socher, Richard; Li, Li-Jia; Kai Li; Li Fei-Fei (2009年6月). 「ImageNet: 大規模階層画像データベース」. 2009 IEEE Conference on Computer Vision and Pattern Recognition . IEEE. pp. 248– 255. doi : 10.1109/CVPR.2009.5206848 . ISBN 978-1-4244-3992-8。
- ^ Robertson, Stephen; Vojnovic, Milan; Weber, Ingmar (2009-04-04). 「ESPゲームの再考」 . CHI '09 Extended Abstracts on Human Factors in Computing Systems . CHI EA '09. ニューヨーク州ニューヨーク: Association for Computing Machinery. pp. 3937– 3942. doi : 10.1145/1520340.1520597 . ISBN 978-1-60558-247-4。
- ^ a b c d GoogleTalksArchive (2012年8月22日).ヒューマン・コンピューティング. 2024年11月13日閲覧– YouTubeより。
{{cite AV media}}:|last=一般的な名前を持っています (ヘルプ) 2006年7月26日のLuis von Ahnによる講演 - ^クリスティアーニ・ネロ (2023). 『近道:なぜ知能機械は人間のように考えないのか』ボカラトン. ISBN 978-1-003-33581-8. OCLC 1352480147 .
{{cite book}}: CS1 メンテナンス: 場所の発行元が見つかりません (リンク)
外部リンク
- 「プロフィール:ルイス・フォン・アン:目的のあるゲーム」 PBS 2008年11月6日。 2009年7月4日時点のオリジナルよりアーカイブ。2024年11月13日閲覧。