
Media Cloudは、時事ニュースの報道をマッピングすることを目的としたオープンソースの コンテンツ分析ツールです。「メディア定義、クロール、テキスト抽出、単語ベクトル化、分析という5つの基本機能を備えています。」[1] Media Cloudは「数百の新聞、数千のウェブサイトやブログを追跡し、検索可能な形式で情報をアーカイブします。このデータベースにより、研究者はマイケル・ジャクソンからイランの選挙に至るまで、重要な人物、場所、出来事を検索し、それらがいつ、どこで、どのくらいの頻度で報道されているかを正確に把握することができます。」[2] Media Cloudは、ハーバード大学バークマン・センター・フォー・インターネット&ソサエティによって開発され、2009年3月にリリースされました。[3] [4] GNU GPL 3+に基づいて配布されています。[5]
2011年10月現在、Media Cloudは主に米国の情報源からニュースを追跡しています。以下の情報源から「ニュース記事を収集」しています。[6]
- 「Google Ad Planner サービスによる米国の主要メディアのトップ 25」(New York Times、 BBCなどを含む)
- 「 Technoratiによる米国で最も影響力のある政治ブログ1000 」(例としてOutside the Beltway [1]など)
- 「Bloglinesで最も人気のあるフィード1000件」( Gawkerなど)
- 「whitehouse.govからのすべての公開フィード」
Media Cloudと提携している(または現在も提携している)企業としては、Morningside Analytics [2]、Betaworks [3]、Bit.ly、Associated Press [4]、Global Voices [5]などが挙げられます。
メディアクラウドの機能
2011年5月6日、バークマンセンターはメディアクラウドを再始動しました。これは、「学者、ジャーナリスト、そしてメディアの世界に関心を持つすべての人が、メディアの注目度に関する定量的な質問をしたり、答えたりできるように設計されたプラットフォームです。1年以上にわたり、主要な主流メディア、アメリカの左派・右派の政治ブログ、そして1000の人気一般ブログなど、1万7000のメディアソースから、毎日約5万件の英語記事を収集してきました。」[7] このデータは、「専門メディアと市民メディアにおける国際危機報道の違いを分析し、2011年初頭を特徴づけた速報ニュースの氾濫に伴うメディアの注目度の急激な変化を研究するために使用されました。」[7]国際的な研究により、「メディアクラウドを用いてロシアとエジプトの専門メディアと市民メディアの構造を理解するための新たな研究」が発表されました。[7] Media Cloudのリニューアルにより、ユーザーはツールを使って「ブロガーやジャーナリストが何に注目し、何を無視し、何を評価し、何を非難しているか」を分析することができるようになりました。[7]
設計プロセス
MITメディアラボとハーバード大学バークマンセンターの間では、メディア環境に関する議論が絶えず行われていましたが、共通の課題に直面していました。それは、特定の疑問への答えを得るために、ニュース記事に関する大規模なデータ処理ソリューションを必要としていたことです。Media Cloudの開発の動機は、特定の疑問ではなく、無数の疑問から生まれました。Media Cloudの開発者は、ウェブサイトのAboutセクションで、このシステムが解決しようとした初期の原動力となった疑問をいくつか挙げています。
- ブロガーは主流メディアにストーリーを紹介するのでしょうか、それともその逆でしょうか?
- ニュースの議題を設定する上で、オンラインメディアと印刷ニュースのどちらがより強力でしょうか?
- 世界のどの地域がさまざまなメディアによって報道され、あるいは無視されているのでしょうか?
- 重要なニュースはどこからどのように始まるのでしょうか?
- 同じイベントを表す競合用語が、異なる出版物ではどのように使用されているか?
- 特定のソースの全体的なカバレッジの組み合わせを特徴付けることができますか?
- 地方ニュースと全国ニュースの報道パターンはどのように違うのでしょうか?
- 特定の問題に関するニュースサイクルを追跡できますか?
- ネット上のコメントがニュースに影響を与えるのか?
データ分析により、ニュース報道のさまざまな側面、例えばメディアソースやニュースを報道する言語などを分析できるようになります。[1]
仕組み
まず、Media Cloudは複数のメディアソースを選択し、それぞれのフィードを抽出します。[1]次に、各フィードをクロールし、どのフィードに記事が追加されているかを確認します。[1]次に、関連する記事からすべてのコンテンツが抽出されます。広告やその他のナビゲーションページはそのまま残ります。[1]各記事のテキストは単語数に分解され、各メディアソースが関連するトピックを議論する際に使用する異なる単語の選択が示されます。[1]その後、単語数は分析され、データの傾向を示すために公開されます。[1]
用途と応用
Media Cloudは、2010年9月から2012年1月まで、バークマン・インターネット&ソサエティ・センターの研究データを取得するために使用されました。この研究では、 COICA - SOPA - PIPA論争に関連する9,757件のオンライン記事を分析しました。このオープンソースアプリケーションは、研究のテキストおよびリンク分析部分に利用されました。 [8]この研究結果は2013年7月に発表されました[6]。
バークマン・センター・フォー・インターネット&ソサエティのウェブサイトでは、この研究からインタラクティブな視覚化マップ[7]を公開しています。このマップは、「メディアソース(地図上では円として表示され、異なる色で異なるメディアタイプを示す「ノード」)を描画し、メディアソースとそのリンクを個別の時間スライス内で追跡し、ユーザーが論争を拡大して、特定の期間中にどのエンティティが議論に参加しているかを確認できるようにするために作成されました...」[8]。このマップでは、リンク分析を使用して、COICA - SOPA - PIPA論争がどのように時間の経過とともに発展したかを視覚化できます。
多くの企業が、メディアクラウドが生み出すこの新しいデータの分析・整理能力を活用しています。RAMPなどの企業は、あらゆる種類のメタデータを分析・作成するための「クラウドベース」の方法を提供しています。[9]
メディアの偏向に関する議論は、メディアクラウドプロジェクトによって、ジャーナリストの個人的な意見の問題ではなく、データに基づいた議論へと議論が変化したという見方によって影響を受けている。[10]
確証バイアスはメディアバイアスの発達の一形態であり、個人が既に持っている信念と一致する情報源を求める。[11]そして確証バイアスの最終的な結果はエコーチェンバーの形成であり、これは論争のすべての側(通常は2つ)が自分たちのことだけを話している状況であり、議論を停滞させ、合意の形成を混乱させる可能性が最も高い。[12]女性ゲーム開発者に対する個人攻撃のエピソードであるゲーマーゲート論争に関するメディアクラウドの分析では、[13]最も一般的な意見の基準で分割された2つのニュースソースと議論のクラスターが示された。分析グラフではこれらのポイント間にリンクがあったが、それらは合意の形成を表すものではなく、ヘイトリンクであると指摘された。ヘイトリンクでは、他のクラスターのソースをリンクするソースは、リンクの内容に強く反対するためにそうする。[14] [15]
影響
メディアクラウドの主な機能は、ウェブクロールを使用してさまざまなソースから定期的に記事を取得し、それらを単語に分解してカウントすることです。これらの単語数は分析され、特定のニュースについてソースが何を言っているかが判断されます。[1]このプロセスはメディアクラウドに固有のものではなく、実際には最近人気の高いストリーム アルゴリズムのアプリケーションです。ストリーム アルゴリズムは、完全な情報バッチが組み立てられるのを待つのではなく、継続的で終わりのないデータ ストリームを処理することを特徴としています。これらのアルゴリズムは、どのトピックが最も人気になるかを知らなくても傾向を監視できるため、非常に便利です。この種の機能は、ネットワーク管理者がどのサイトのトラフィック量が最大かを動的に確認しようとしたときに最初に顕著に現れました。そこから、ストリーム アルゴリズムは、プログラムを金融情報に動的に作用させるために使用されたり、実験で分析可能な量を超えるデータを生成する研究者によって、初期データを動的にフィルター処理するために使用されたりしています。[16]メディアクラウドも同様にストリームアルゴリズムの機能を活用し、様々なソースをクロールしながら単語をニュースに動的に関連付け、ユーザーが興味を持っている単語や関連するメディアレポートに基づいて文章を生成するという独自のサービスを提供しています。
イデオロギー
市民メディアセンターは、政治活動を促進し、市民メディアを支援することを目標としており、そのためにツールとして活用できる技術革新を生み出す拠点を提供し、自治体、国家、世界レベルでコミュニティベースのデザインプロセスを調整しています。[17]
メディアクラウドは、市民メディアセンターが使用するツールの1つであり、さまざまな情報源からのニュース報道に関するデータ分析を提供する機能を備えており、イベントやカテゴリのニュース報道の歴史に関する結論を導き出したり、市民の関与を生み出したりするために、多くの状況で使用されてきました。[18]
Media Cloudの開発者は、活動家が執筆したメディア記事の影響を検証するためのツールを提供することで、オンライン活動を支援することを目指しています。オンライン活動家は、このツールを用いて取得したデータ分析によって自らの影響力を検証し、ツールが到達できなかった重要な地域を探すことができます。また、特定のターゲットグループに届いていないコンテンツの共有も、このプラットフォームを利用することで可能になります。[19]
このプロジェクトは、イノベーションによるソリューションの 1 つであると自認しています。
研究
ソパ/ピパ
ハーバード大学バークマン・インターネット&社会センターの研究者5名が、オンライン著作権侵害防止法の失敗の原因は国民的議論にあり、それがどのように役割を果たしたかを論じた社会研究を提唱した。データ分析は、メディアクラウドを用いて問題に関わった人々のプロフィールを分析したものである。この研究では、議論に関わった人々について、あらゆる政治的信条を持つ人々がリストアップされている。報道源や議論のプラットフォームに関しては、主流メディアよりもハイテクメディア、ゲームサイト、政治ブログが大きな役割を果たしたと言われている。研究の主な結論は、議論の二極化ではなく政治的見解の多様化が合意形成を可能にし、政策立案者に法案反対票を投じるよう圧力をかけたというものである。[20]
トレイボン・マーティンの死
ピュー・リサーチ・センターは、フロリダ州の警察官に胸を撃たれた少年トレイボン・マーティンの殺害事件を、事件発生前の5年間で最も多く報道された社会的なニュースと分類した[21] 。メディアクラウドを用いて行われたこの研究は、オルタナティブメディアの参加が、事件の焦点を銃撃事件から人種差別に関する一連の報道へと移すのに役立ったと示唆している[22] [23]。
中絶
ジュリア・ウェイチャートとキャサリン・アイダによる研究では、メディアクラウドを利用して、ソーシャルメディアで最も共有された中絶論争に関するニュース報道の性質を分析した。提唱者によると、研究の数値はメディア報道が立法と運動に集中していることを示しているという。また、ニュース報道のソースを特定の政治的傾向(保守、リベラル、中道、リバタリアン)を持つように手作業で分類した後、クラスター内で画像の使用が異なっていることを指摘し、リベラルメディアは抗議活動、主流メディアは立法の写真、保守メディアは胎児または生きた乳児の画像を掲載していると分類した。ジュリアとキャサリンはこれらの結果から、中絶反対派のナラティブが明確に形成されていると見ているのとは対照的に、中絶賛成派には戦略が欠けていると結論付けた。 [ 18]
シャルリー・エブドとバガ虐殺
2015年の最初の週に、イスラム過激派による宗教暴力事件がバガとパリで2件発生した。メディアThe ConversationがMedia Cloudを使用して実施した調査では、この2つの事件に関する報道を評価・比較した。調査結果によると、世界的にはシャルリー・エブド銃撃事件[24]の報道がバガの虐殺[25]よりもはるかに大きかった。また、ナイジェリア国内でもパリ攻撃の報道がバガの虐殺を上回ったと報告されている。この報告では、メディアの注目度が不均一なのは、ヨーロッパ中心主義だけでなく、ボコ・ハラムとナイジェリア軍の紛争でどちらの側につくかが難しいことにも起因しているとしている。[26]
ネット中立性
メディアクラウドのデータ分析結果に基づくバークマン・クライン・センターの研究では、連邦通信委員会によるネット中立性に関する政策案の却下にインターネットが及ぼした影響について調査し[27]、議論の多様性が控訴の結果を形作るのに貢献したと主張した[28] 。
ニルバーヤ事件
ニューデリーで医学生ニルバヤが集団レイプされた事件[29]は、インドにおける性的暴行に関する報道の増加を引き起こした。この事件は、メディアクラウドによる性的暴行報道の実態分析の調査研究の焦点となった。調査推進派は、報道ではこうした事件の原因としてジェンダー不平等が考慮されておらず、得られたデータ分析に基づき、事件は単なるエピソード的な出来事として扱われ、加害者だけが責められるとされたと主張した[30] 。
将来の使用
Media Cloudがリニューアルオープンした日、イーサン・ザッカーマンは次のように述べました。「私たちが提供するツールが、ジャーナリズム卓越プロジェクト(PEJ)のニュース報道やニューメディア指標といった素晴らしい取り組みを補完するものとなることを願っています。PEJのツールは、アメリカのメディアでどのような話題が議論されているかを理解するためのゴールドスタンダードだと考えています。PEJは、才能あるプログラマーチームを擁し、メディアエコシステムの様々な側面をサンプリングして何が議論されているかを探る魔法のような仕事をしています。私たちは膨大なデータセット、アルゴリズム、そして自動化を駆使し、話題ではなく言語に焦点を当てた、異なる全体像を提示します。」[7]
Media Cloudの将来的な用途としては、スマートフォンやタブレット向けのアプリケーションを開発し、パソコンから離れた場所にいるユーザーにプラットフォームを紹介することが考えられます。Media Cloudアプリは、外出先でのニュースソースとしてユーザーを支援できます。Media Cloudが様々な情報サイトに展開するのであれば、ソーシャルメディアサイトをターゲットにし、そこにニュースを取り込むことも可能です。TwitterやFacebookは、 Media Cloudの狙いと似たようなトレンドニュースやトピックを表示する機能を導入しています。
このツールは、研究対象となった出来事の反響を理解するために、メディアとして認められていない情報源にも拡大しています。[31]ソーシャルメディアは、ニュースの共有だけでなく、共有されたコンテンツへの反応も含むため、主な対象となっています。[32]
参考文献

- ^ abcdefgh Media Cloud. About アーカイブ 2012年9月8日archive.today . 2011年10月12日閲覧
- ^ パトリシア・コーエン「話題のニュースから過去のものまで:サイバースペースでニュースを追う」ニューヨーク・タイムズ、2009年8月5日
- ^ バークマンセンター. メディアクラウド. 2011年10月12日閲覧
- ^ アリサ・ミラー著『メディア・メイクオーバー:ワンクリックでニュースを良くする』TEDブックス、2011年
- ^ “Mediacloud/Backend”. GitHub . 2022年1月22日.
- ^ Media Cloud. メディアセット. 2011年10月12日閲覧
- ^ abcde Zuckerman, Ethan. 「Media Cloud、リニューアル」。2014年2月27日時点のオリジナルよりアーカイブ。2014年2月20日閲覧。
- ^ ab Beckman Center for Internet and Society. 「新刊:『社会動員とネットワーク化された公共圏:SOPA-PIPA論争のマッピング』」ハーバード大学. 2014年3月19日閲覧。
- ^ “MediaCloud® - RAMP”. 2014年2月17日時点のオリジナルよりアーカイブ。2014年2月23日閲覧。
- ^ Wang, Shan (2016年6月6日). 「この新たな共同研究は、メディアに関する果てしない議論に、実際の確かなデータを提供することで役立つことを期待しています」. NiemanLab . 2016年12月7日閲覧。
- ^ プラウス、スコット (1993). 『判断と意思決定の心理学』 マグロウヒル・エデュケーション. p. 233. ISBN 9780070504776。
- ^ sdf (2004年6月24日). 「ジョン・ゴレンフェルド、救世主ムーン、そしてメディアのエコーチェンバー」.デイリー・コス. 2016年12月7日閲覧。
- ^ Eördögh, Fruzsina (2014年11月25日). 「ゲーマーゲートと新たなデジタル破壊工作員の大群」 . 2016年12月7日閲覧。
- ^ Tufekci, Zeynep (2014年3月28日). 「ソーシャルメディア・ビッグデータに関する大きな疑問:代表性、妥当性、その他の方法論的落とし穴」arXiv : 1403.7400 [cs.SI].
- ^ スミス、アリッサ、ネイサン・マティアス(2015年11月4日)「橋かヘイトリンクか?メディア紛争における共通リンクの意味」 。 2016年12月7日閲覧。
- ^ 「ブリトニー・スピアーズ問題」American Scientist. www.americanscientist.org。2008年8月20日時点のオリジナルよりアーカイブ。
- ^ イーサン・ザッカーマン. 「市民メディアセンターについて」. 2016年12月20日時点のオリジナルよりアーカイブ。 2016年12月7日閲覧。
- ^ ab Ethan Zuckerman (2015年8月26日). 「メディア報道を理解する:メディアクラウドを使った7つの夏の実験」 . 2016年12月7日閲覧。
- ^ イーサン・ザッカーマン (2015年10月30日). 「イノベーターは破壊的かつ公正な未来を築くことができるか?」2016年12月7日閲覧。
- ^ Benkler他 (2013年7月). 「社会動員とネットワーク化された公共圏:SOPA-PIPA論争のマッピング」SSRN 2295953.
- ^ Burch, Audra DS; Laura Isensee (2012年3月22日). 「トレイボン・マーティン:ビデオゲームが大好きで、プロムを楽しみにしていた典型的なティーンエイジャー」マイアミ・ヘラルド. 2012年3月23日閲覧。
- ^ Graeff, Erdhaert、Matt Stempeck、Ethan Zuckerman (2014年1月17日). 「『トレイボン・マーティン』をめぐる戦い:オンラインとオフラインにおけるメディア論争のマッピング」First Monday . 2016年12月7日閲覧。
- ^ キャロライン・オドノヴァン (2014年2月14日). 「犯罪が政治問題になる仕組み:トレイボン・マーティンと、異なるメディアがニュースを共創する仕組み」 . 2016年12月7日閲覧。
- ^ 「シャルリー・エブド襲撃:3日間のテロ」BBCニュース、2015年1月14日。 2016年12月7日閲覧。
- ^ ドネリー、エリザベス(2015年1月13日)「ボコ・ハラム虐殺:問うべき7つの質問」 。 2016年12月7日閲覧。
- ^ ザッカーマン、イーサン(2015年1月13日)「シャルリー・エブドとバガ虐殺に関するメディア報道:対照研究」2016年12月7日閲覧。
- ^ ロバート・ラノン、アペンドルトン(2014年9月2日)「FCCのネット中立性計画に関する80万件のパブリックコメントから何が学べるか?」2016年12月7日閲覧。
- ^ Faris, Robert; et al. (2015年2月). 「インターネットにまた1つの勝利? 米国のネット中立性政策論争におけるネットワーク化された公共圏の役割」(PDF) . 2016年12月7日閲覧。
- ^ エマ・ヘンダーソン (2015年12月20日). 「ニルバヤ事件:デリーのギャングレイプ犯の少年が更生施設で3年間服役した後、解放され怒りと広範な抗議活動」 Independent.co.uk . 2022年5月12日時点のオリジナルよりアーカイブ。 2016年12月7日閲覧。
- ^ アヌシュカ・シャー(2015年12月10日)「インドのニュースが女性問題を報道する上での問題点」2016年12月7日閲覧。
- ^ ザッカーマン、イーサン(2015年8月24日)「デジタルメディアとガーナの世界的舞台における地位」グラフィック・オンライン。 2016年12月7日閲覧。
- ^ Kelsey, Alley (2016年11月27日). 「今日のソーシャルメディアと社会への影響」 . 2016年12月7日閲覧。
さらに読む
- Hal Roberts; et al. (2021), Media Cloud: オープンウェブ上のグローバルニュースの大規模なオープンソースコレクション, arXiv : 2104.03702
外部リンク
- メディアクラウドホームページ
- メディアクラウド ソースコード (GPL 3+)