ムービーレンズ

MovieLensは、ウェブベースの推薦システムであり、ユーザーの好みに基づいて、視聴すべき映画を推薦する仮想コミュニティです。メンバーの映画評価と映画レビューを協調フィルタリングすることで、これらのデータを基に推薦を行います。MovieLensには、約8500本の映画に対する約1100万件の評価が登録されています。^{[ 1 ]} MovieLensは、ミネソタ大学コンピュータサイエンス工学部の研究所であるGroupLens Researchによって1997年に開発されました。^[²^]パーソナライズされた推薦に関する研究データを収集するためです。^[³^]

歴史

MovieLensは、GroupLensが開発した最初のレコメンデーションシステムではありませんでした。1996年5月、GroupLensはNet Perceptionsという商業ベンチャーを設立し、E! OnlineやAmazon.comなどの顧客にサービスを提供しました。E! OnlineはNet Perceptionsのサービスを利用してMoviefinder.comのレコメンデーションシステムを開発し、^{[ 3 ]} Amazon.comはNet Perceptionsの技術を利用して、消費者向け購入支援のための初期のレコメンデーションエンジンを開発しました。^{[ 4 ]}

1997年に別の映画推薦サイトであるeachmovie.org ^{[ 5 ]}が閉鎖された際、このサイトを開発した研究者たちは、収集した匿名の評価データを他の研究者が利用できるように公開しました。ブレント・ダーレンとジョン・ハーロッカーが率いるGroupLens Researchチームは、このデータセットを用いて新しい映画推薦サイトを立ち上げ、MovieLensと名付けました。MovieLensは設立以来、非常に注目を集める研究プラットフォームとなっています。そのデータに基づく知見は、カナダ人ジャーナリスト、マルコム・グラッドウェルによるニューヨーカー誌の記事で詳細に論じられており^{[ 6 ]}、ABC Nightlineのエピソード全編でも取り上げられています^{[ 7 ]} 。さらに、MovieLensのデータは、カーネギーメロン大学、ミシガン大学、ミネソタ大学、ピッツバーグ大学の共同研究「社会心理学を用いたオンラインコミュニティへの貢献促進」など、いくつかの研究において重要な役割を果たしています^{[ 8 ] 。}

2015年の春、「movielens」を検索すると、Googleブックスで2,750件、Google Scholarで7,580件の検索結果が表示された。^{[ 9 ]}

推奨事項

MovieLensは、映画の評価など、ウェブサイトのユーザーからの入力に基づいて推薦を行う。^{[ 2 ]}サイトは、アイテム-アイテム、^[¹⁰^] ユーザー-ユーザー、正規化SVDなどの協調フィルタリングアルゴリズムを含むさまざまな推薦アルゴリズムを使用する。^[¹¹^]さらに、新規ユーザーのコールドスタート問題に対処するために、MovieLensは嗜好獲得法を使用する。^[¹²^]このシステムは、新規ユーザーに、さまざまなグループの映画（たとえば、ブラックユーモアのある映画とロマンティックコメディ）をどれだけ楽しんでいるかを評価するように求める。この調査で記録された嗜好により、ユーザーがウェブサイトで多数の映画を評価する前であっても、システムは最初の推薦を行うことが可能になる。

MovieLensは、各ユーザーについて、ウェブサイト上の特定の映画をどのように評価するかを予測します。^{[ 13 ]}これらの予測された評価に基づいて、システムはユーザーが高く評価する可能性が高い映画を推奨します。ウェブサイトは、ユーザーができるだけ多くの完全に視聴した映画を評価することを提案します。そうすることで、システムはユーザーの映画の好みをより正確に把握し、推奨の精度が向上します。^{[ 3 ]}しかし、MovieLensの評価インセンティブアプローチは必ずしも効果的ではありません。研究者によると、システムに掲載されている映画の20%以上は評価が非常に少なく、推奨アルゴリズムは加入者がそれらの映画を気に入るかどうかを正確に予測できないことが分かりました。^{[ 8 ]}映画の推奨には、大量の映画評価を「シードデータセット」として扱うようなマーケティング価値を含めることはできません。^{[ 1 ]}

MovieLensは映画の推薦に加えて、各映画の俳優や監督のリストなど、個々の映画に関する情報も提供します。ユーザーはタグ（「書籍に基づいている」「長すぎる」「大げさ」といったメタデータの一種）を投稿・評価することができ、これらのタグは映画推薦システムの精度向上に活用されます。^{[ 3 ]}

受付

1997年9月までに、ウェブサイトの利用者は5万人を超えた。^{[ 3 ]}アクロン・ビーコン・ジャーナルのポーラ・シュライスがこのウェブサイトを試用したところ、彼女の映画の好みに基づいて新しい映画を推薦するという点で、このウェブサイトの正確さに驚いた。^{[ 13 ]}

映画の推薦以外にも、Solution by SimulationはMovieLensのデータを使ってオスカー予想を行っている。^{[ 14 ]}

研究

2004年、カーネギーメロン大学、ミシガン大学、ミネソタ大学、ピッツバーグ大学の研究者との共同研究で、社会心理学の社会的手抜きと目標設定の原則に基づいたインセンティブをMovieLensユーザーに対して設計し、テストしました。^{[ 8 ]} 研究者たちは、貢献度の低さがコミュニティの問題であるように思われることに着目し、ユーザーがより多くの映画を評価しレビューするように動機付ける最も効果的な方法を見極めるための研究を立ち上げました。この研究では2つのフィールド実験が行われました。1つは、ユーザーに貢献の独自性とそれに伴う利益を思い出させる電子メールメッセージを使用するもので、もう1つはユーザーに貢献に関する個人またはグループの目標をいくつか与えるものでした。

MovieLensコミュニティの累積的な反応を分析した結果、ユーザーは自身の独自性を意識させられた際にコミュニティに貢献する可能性が高くなり、自分の貢献は他のユーザーが提供できるものと重複するものではないと考えるようになることが分かりました。また、研究者の仮説とは反対に、評価することで得られる利益、あるいは自分が評価することで他のユーザーが得る利益が強調されると、貢献する可能性が低くなることを発見しました。最後に、独自性と利益の関係を裏付ける証拠は得られませんでした。

2つ目の実験では、ユーザーが具体的かつ挑戦的な目標を与えられ、グループの目標達成には自分の貢献が必要だと思わせられた場合、貢献する可能性が高くなることが明らかになりました。この研究では、この特定の状況において、ユーザーにグループレベルの目標を与えると、個人目標と比較して実際に貢献度が上昇することが分かりました。研究者らは、社会的手抜きの影響により、個人目標では逆の結果になると予測していました。グループと個人の両方において、目標の難易度とユーザーの貢献度の関係は、ある一定の難易度の閾値を超えると、ロックとレイサムの目標設定理論で以前に仮説されていたようにパフォーマンスが停滞するのではなく、パフォーマンスが低下するという弱い証拠を示しました。

データセット

ミネソタ大学のヒューマンコンピュータインタラクション研究機関であるGroupLens Researchは、 MovieLensウェブサイトから収集した評価データセットを研究目的で提供しています。データセット全体は、27万人のユーザーによる4万5000本の映画に対する2600万件の評価と75万件のタグ適用データで構成されています。また、1100個のタグに1200万件の関連性スコアが付与されたタグゲノムデータも含まれています（最終更新日：2017年8月）。^{[ 15 ]} 10万件、100万件、1000万件、2000万件程度の小規模なデータセットも多数提供されています。^{[ 9 ]}

MovieLensデータセットに基づいて実施された研究は数多くあります。LiuらはMovieLensデータセットを用いて、大規模オブジェクトの影響を抑制することで改良されたランダムウォークアルゴリズムの効率性を検証しました。^{[ 16 ]} GroupLensにはデータセットの利用条件があり、インターネット経由でのリクエストを受け付けています。

参考文献

^ ^a ^b「MovieLensデータベースはテクノロジー商業化から入手可能」。
^ ^a ^bスコフィールド、ジャック (2003年5月22日). 「Land of Gnod」 .ガーディアン紙. ロンドン.
^ ^a ^b ^c ^d ^eオジェダ＝ザパタ、フリオ (1997年9月15日). 「新しいサイトが映画レビューをパーソナライズ」セントポール・パイオニア・プレス. p. 3E.
^ブース、マイケル (2005年1月30日). 「コンピューターはどのようにして私たちについてこれほど多くのことを知るのか？」デンバー・ポスト紙. p. F01.
^リム・ミョンウン、キム・ジュンテ (2001). 「Webインテリジェンス：研究開発」.第1回アジア太平洋Webインテリジェンス会議議事録：研究開発. アジア太平洋Webインテリジェンス会議. コンピュータサイエンス講義ノート. 第2198巻/2001年. シュプリンガー・ベルリン/ハイデルベルク. pp. 438–442 . doi : 10.1007/3-540-45490-X_56 . ISBN 978-3-540-42730-8。
^マルコム・グラッドウェル（1999年10月4日）「Annals of Marketing: The Science of the Sleeper: How the Information Age Could Blow Away the Blockbuster」『ニューヨーカー』75 (29): 48–55 . 2009年12月30日時点のオリジナルよりアーカイブ。 2009年12月29日閲覧。
^クルウィッチ、ロバート（1999年12月10日）「ABCナイトライン：ソウルメイト」 ABC。
^ ^a ^b ^c Beenen, Gerard; Ling, Kimberly; Wang, Xiaoqing; Chang, Klarissa; Frankowski, Dan; Resnick, Paul; Kraut, Robert E. (2004). 「社会心理学を用いたオンラインコミュニティへの貢献促進」CommunityLab : 93–116 . CiteSeerX 10.1.1.320.5540 .
^ ^a ^b Joseph A. Konstan、F. Maxwell Harper (2016年1月). 「MovieLensデータセット：歴史と文脈」(PDF) . ACM Transactions on Interactive Intelligent Systems . 5 (4). doi : 10.1145/2827872 . ISSN 2160-6455 . Wikidata Q35262812 .
^ Badrul Sarwar、George Karypis、Joseph Konstan、John T. Riedl (2001年4月). 「アイテムベース協調フィルタリング推奨アルゴリズム」(PDF) .第10回国際ワールドワイドウェブ会議議事録: 285–295 . doi : 10.1145/371920.372071 . Wikidata Q135273914 .
^ Ekstrand, Michael D. 「レコメンデーションの違いを識別するためのレコメンデーションエンジニアリングツールと実験に向けて」ミネソタ大学論文、2014年。
^ Chang, Shuo, F. Maxwell Harper, Loren Terveen. 「レコメンデーションシステムにおけるアイテムグループを用いた新規ユーザーのブートストラップ」第18回ACMコンピュータ支援協働作業およびソーシャルコンピューティング会議議事録。ACM、2015年。
^ ^a ^bシュライス、ポーラ (2000年11月13日). 「サイトは誰もが批評家になれるようにする」アクロン・ビーコン・ジャーナル. p. D2.
^ ウォルト・ヒッキー「オスカー予想は的中？データでわかる！」FiveThirtyEight. 2016年2月18日. ウェブ. 2016年3月8日. < https://fivethirtyeight.com/features/oscar-data-model-predictions-2015/ >
^ 「GroupLens」 .
^ Chuang Liu, Zhen Liu, Zi-Ke Zhang, Jun-Lin Zhou, Yan Fu, Da-Cheng Nie (2014). 「バイアス付きランダムウォークによるパーソナライズされた推奨アルゴリズム」.第11回国際コンピュータサイエンスおよびソフトウェアエンジニアリング合同会議 (JCSSE) .{{cite news}}: CS1 maint: 複数の名前: 著者リスト (リンク)

外部リンク

公式サイト

[license.umn.edu-1] 「MovieLensデータベースはテクノロジー商業化から入手可能」。

[guardian-2] スコフィールド、ジャック (2003年5月22日). 「Land of Gnod」 .ガーディアン紙. ロンドン.

[stpaul-3] オジェダ＝ザパタ、フリオ (1997年9月15日). 「新しいサイトが映画レビューをパーソナライズ」セントポール・パイオニア・プレス. p. 3E.

[denver-4] ブース、マイケル (2005年1月30日). 「コンピューターはどのようにして私たちについてこれほど多くのことを知るのか？」デンバー・ポスト紙. p. F01.

[5] リム・ミョンウン、キム・ジュンテ (2001). 「Webインテリジェンス：研究開発」.第1回アジア太平洋Webインテリジェンス会議議事録：研究開発. アジア太平洋Webインテリジェンス会議. コンピュータサイエンス講義ノート. 第2198巻/2001年. シュプリンガー・ベルリン/ハイデルベルク. pp. 438–442 . doi : 10.1007/3-540-45490-X_56 . ISBN 978-3-540-42730-8。

[6] マルコム・グラッドウェル（1999年10月4日）「Annals of Marketing: The Science of the Sleeper: How the Information Age Could Blow Away the Blockbuster」『ニューヨーカー』75 (29): 48–55 . 2009年12月30日時点のオリジナルよりアーカイブ。 2009年12月29日閲覧。

[7] クルウィッチ、ロバート（1999年12月10日）「ABCナイトライン：ソウルメイト」 ABC。

[:0-8] Beenen, Gerard; Ling, Kimberly; Wang, Xiaoqing; Chang, Klarissa; Frankowski, Dan; Resnick, Paul; Kraut, Robert E. (2004). 「社会心理学を用いたオンラインコミュニティへの貢献促進」CommunityLab : 93–116 . CiteSeerX 10.1.1.320.5540 .

[The_MovieLens_Datasets:_History_and_Context-9] Joseph A. Konstan、F. Maxwell Harper (2016年1月). 「MovieLensデータセット：歴史と文脈」(PDF) . ACM Transactions on Interactive Intelligent Systems . 5 (4). doi : 10.1145/2827872 . ISSN 2160-6455 . Wikidata Q35262812 .

[Item-based_collaborative_filtering_recommendation_algorithms-10] Badrul Sarwar、George Karypis、Joseph Konstan、John T. Riedl (2001年4月). 「アイテムベース協調フィルタリング推奨アルゴリズム」(PDF) .第10回国際ワールドワイドウェブ会議議事録: 285–295 . doi : 10.1145/371920.372071 . Wikidata Q135273914 .

[11] Ekstrand, Michael D. 「レコメンデーションの違いを識別するためのレコメンデーションエンジニアリングツールと実験に向けて」ミネソタ大学論文、2014年。

[12] Chang, Shuo, F. Maxwell Harper, Loren Terveen. 「レコメンデーションシステムにおけるアイテムグループを用いた新規ユーザーのブートストラップ」第18回ACMコンピュータ支援協働作業およびソーシャルコンピューティング会議議事録。ACM、2015年。

[akron-13] シュライス、ポーラ (2000年11月13日). 「サイトは誰もが批評家になれるようにする」アクロン・ビーコン・ジャーナル. p. D2.

[14] ウォルト・ヒッキー「オスカー予想は的中？データでわかる！」FiveThirtyEight. 2016年2月18日. ウェブ. 2016年3月8日. < https://fivethirtyeight.com/features/oscar-data-model-predictions-2015/ >

[grouplens-15] 「GroupLens」 .

[paper-16] Chuang Liu, Zhen Liu, Zi-Ke Zhang, Jun-Lin Zhou, Yan Fu, Da-Cheng Nie (2014). 「バイアス付きランダムウォークによるパーソナライズされた推奨アルゴリズム」.第11回国際コンピュータサイエンスおよびソフトウェアエンジニアリング合同会議 (JCSSE) .{{cite news}}: CS1 maint: 複数の名前: 著者リスト (リンク)

[ 1 ]

[

[

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ] 。

[ 9 ]

[

[

[

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]