
アルゴリズムキュレーションとは、レコメンデーションシステムやパーソナライズ検索などの技術によってオンラインメディアを選択することです。キュレーションとは、推定された興味に基づいてオンラインコンテンツやレコメンデーションを選択的に共有することです。[ 1 ]キュレーションアルゴリズムは、協調フィルタリングやコンテンツベースフィルタリングなどの様々なフィルタリング手法を実装することで、このタスクを活用します。例としては、Twitterフィード、Facebookニュースフィード、Googleパーソナライズ検索などの検索エンジンやソーシャルメディア製品が挙げられます。[ 2 ]
アルゴリズムによるキュレーションは、今日の人々がオンラインでつながる方法において重要な役割を果たしています。[ 3 ] [ 4 ]今日オンラインで提示される情報のほとんどは、何を保存、アーカイブ、共有、または無視するかを決定しており、これは外部ソースによってサポートされる必要があります。[ 3 ] [ 4 ]そのため、プラットフォームはニュースフィードアルゴリズムを使用して各ユーザーに何を表示するかを決定します。[ 3 ] [ 4 ]これらのアルゴリズムは複雑であると理解されており、その仕組みを理解するにはITに関する特定の知識と教育が必要です。[ 3 ] [ 4 ]
初期のプラットフォームでは、ユーザーが圧倒されないように情報をフィルタリングする手段が必要でした。[ 3 ]この結果、最新または最も人気のある投稿を表示する第一世代のランキングアルゴリズムが生まれました。[ 3 ]第二世代では、ユーザーがより長い時間プラットフォームに留まるようにコンテンツをキュレーションするアルゴリズムが実証されました。[ 3 ]アルゴリズムによるキュレーションは、知識、注目、政治的露出も形成します。[ 4 ]人々が日々目にするものを形作る上で、このことがアルゴリズムが強力なゲートキーパーとして機能し、ユーザーがどのような新しいコンテンツに触れるかを決定する根拠となります。[ 4 ]
アルゴリズムによるキュレーションは情報源の多様性を高め、外部リンクの数を減らすことで外部情報へのアクセスを制限する。[ 4 ]政治的な内容に基づくトピックは、一部のCOVID-19の健康情報よりも関連性が高くなる。[ 4 ]研究者はエージェントベースモデリングを使用して、これらのシステム内の問題を発見する。[ 4 ]これらの逆境と動機はユーザーのエンゲージメントを高める一方で、誤情報と政治的二極化は悪化する。[ 4 ]目的は、ユーザーの行動、情報、アルゴリズムがどのように相互に影響し合うかを明らかにすることである。[ 4 ]したがって、情報過多への対応として、アルゴリズムによるキュレーションはソーシャルメディア上の膨大な量のコンテンツへの対応として機能する。[ 3 ] [ 4 ]
AI駆動システムにより、ニュースフィードは、 AIの中核機能である情報の予測、パーソナライズ、最適化を行うようになりました。[ 3 ] [ 4 ]これらの特性は、人が見るもの、共有するもの、考えるものを変えることで、人間の認識と行動を変えます。[ 3 ] [ 4 ]現在、研究者は計算シミュレーションモデルを採用し、AI駆動型キュレーションが大規模な社会的成果をどのように形作るのかを理解しています。[ 3 ] Twitterなどの他のプラットフォームは、単純な時系列フィードに移行しました。[ 4 ]現在、これらのプラットフォームでは、情報をパーソナライズする複雑なAI搭載ランキングシステムを使用しています。[ 4 ]
その後、アルゴリズムによるキュレーションは、開発に重点を置いたAI搭載システムへと進化しました。[ 3 ]現在では、高度なスケールと操作により、新たな研究では、人間が理解できないAIシステムに対応するために高度なモデリングツールを使用しています。[ 3 ] Twitterなどのプラットフォームは、シーケンシャルフィードを廃止しました。[ 4 ]これらのプラットフォームは、パーソナライズされた情報を作成するために、AI搭載の計算システムに切り替えました。[ 3 ]これらのシステムは、人間が行うには現実的ではない決定を下します。[ 4 ]
協調フィルタリング(CF)手法は、人の使用パターンに基づいて推奨事項を作成します。[ 5 ] CFは、人の興味を同様の興味を持つ人とマッチングさせることで、その人のアイテムに対する欲求を予測します。[ 5 ]このプロセスにより、志を同じくする人々の間で評価を共有できます。[ 5 ] CFは、機械ではなく人間によるコンテンツの分析に基づいています。[ 5 ] CFシステム(ソーシャルメディアでよく見られる)のユーザーは、自分がインタラクションしたアイテムを評価します。この評価によって興味のプロファイルが作成されます。[ 5 ]次に、CFシステムはそのユーザーを同様の興味を持つ他のユーザーとマッチングさせます。[ 5 ]マッチングされると、それらの類似ユーザーからの評価を使用して、ユーザーへの推奨事項が生成されます。[ 5 ]協調フィルタリングの主な利点は、テキスト、アート、作品、音楽、投資信託など、さまざまな種類のコンテンツでフィルタリングできることです。また、味や品質など、複雑で表現が難しい概念に基づいてフィルタリングします。[ 6 ]
もう 1 つの一般的な推薦システムの実装は、コンテンツベースフィルタリング (CBF) です。CBF では、ユーザーが好むアイテムの種類に関する情報を提供するユーザープロファイルが構築されます。[ 6 ] [ 7 ]これは、アイテムを説明するために使用されるキーワードに基づいています。[ 6 ] [ 7 ]このアプローチでは、ユーザーが過去に好んだアイテムに似たアイテム (またはユーザーが探しているアイテムに似たアイテム) を提示することで推薦が行われます。[ 7 ] CBF メソッドは、一連の個別の属性と機能に基づいて各アイテムのプロファイルを作成します。[ 7 ]次に、アイテム機能の重み付けベクトルに基づいて、ユーザーのコンテンツベースのプロファイルを作成します。[ 6 ]これは、ユーザーが以前に評価または購入したアイテム、またはユーザーが現在興味を持っているアイテムや現在閲覧しているアイテムから作成されます。[ 6 ]重みは、ユーザーにとっての各機能の重要度を表します。[ 6 ]これらの重みを計算する方法は、ベイズ分類器、クラスター分析、決定木、人工ニューラルネットワークなど、様々です。[ 6 ]計算手法に関係なく、重み付きベクトルの目的は同じです。つまり、ユーザーが提案されたアイテムを気に入る可能性を決定することです。[ 6 ]このプロセスを説明するのに役立つコンテンツベースフィルタリングの1つの例として、Pandora Radioがあります。ユーザーがPandoraにアクセスすると、ステーションを作成するためにアーティスト、ジャンル、または作曲家を入力するように求められます。[ 6 ]次に、PandoraはCBFを使用して、ユーザーが指定した曲、アーティスト、またはジャンルに類似した属性を持つ音楽を検索します。[ 6 ]
アルゴリズムは、ユーザーにとって最も関連性の高いコンテンツをランク付けして提案するレコメンデーションシステムによって部分的にキュレーションされます。コンテンツは、特定のユーザーによる暗黙的および明示的な入力に基づいてランク付けされます。[ 8 ]暗黙的なランキングには、特定のアイテムの閲覧時間やエンゲージメント時間などが含まれます。[ 8 ]ユーザーが「いいね!」したアイテム(メディア投稿、ストアページ、ニュース記事、共有アイテムなど)は、アルゴリズムがコンテンツを推奨するために使用する明示的なデータです。[ 8 ]
パーソナライズ検索は、ユーザーの明示的なクエリ以外の外部要因を活用して、ユーザーに最も関連性の高い結果を取得することを目的としています。ユーザーの過去のクエリ、履歴、関心事によって追加のコンテキストが作成され、アルゴリズムの出力が絞り込まれます。[ 9 ] X(旧Twitter)やBlueskyなどのソーシャルメディアプラットフォームは、類似ユーザーからの推奨事項や、ユーザーが交流したコンテンツを提供します。[ 10 ]さらに、パーソナライズ検索では、特定のフレーズやハッシュタグを含むコンテンツを推奨からブロックするオプションを提供することで、検索結果を明示的にフィルタリングできます。[ 11 ]パーソナライズ検索は、コンテンツベースのフィルタリングに基づいて構築され、初めてのユーザーの初期コンテキストを作成する場合があります。[ 6 ]検索エンジンや小売業者などの他の種類の商用ウェブサイトも同様のプロセスを使用して、特定のユーザーに合わせてカスタマイズされた情報や製品を提供しています。
人工知能は、大量のデータ処理が可能な機械学習モデルを活用し、現代のアルゴリズムによるキュレーションにおいて重要な役割を果たしている。[ 12 ]例えば、ディープラーニングと強化学習により、キュレーションアルゴリズムは、確立されたアプローチと組み合わせて、より正確にユーザーの好みを予測することができる。[ 12 ]これにより、プラットフォームはユーザーが目にする内容をほぼ瞬時に調整することができる。[ 12 ]ソーシャルメディアやストリーミングサービスの文脈では、これはAIが関連性が高いと判断した内容を強調するようにフィードを配置し、トレーニングデータからのバイアスを保持することを意味する。[ 13 ]
X(旧Twitter)などのソーシャルメディアプラットフォームのアルゴリズムは、ユーザーが積極的に関与すると予想されるコンテンツを推奨するため、エコーチェンバーフィードのキュレーションにつながる可能性があります。視点の異なる投稿やアカウントはアルゴリズムによって互いに推奨される可能性が低くなり、同じ考えを持つユーザーが孤立し、情報源とトピックの多様性が低下する可能性があります。[ 4 ]たとえば、Facebookのニュースフィードは、ユーザーの興味に合ったコンテンツを広め、既存の見解を強化するように特別に設計されています。[ 14 ]プロモーションコンテンツはユーザーの関与を維持することを目的としていますが、既存の見解以外のコンテンツに関与する機会をほとんど提供しないフィルターバブルを作成する可能性があります。ユーザーはコンテンツをブロックすることで反対意見を積極的に除外するオプションがあり、これがエコーチェンバーの形成をさらに助長します。[ 4 ]
ソーシャルメディアプラットフォームに共通するパターンは、少数のユーザーによるアルゴリズムの支配です。最もアクティブなユーザー、フォロワー数の多いユーザー、エンゲージメント率の高いユーザーが作成したコンテンツは、個人のフィードのわずかな割合を占めるに過ぎません。[ 4 ]