敵対的情報検索(AR)は、情報検索におけるトピックの一つであり、悪意を持って操作されたデータソースを扱う戦略に関するものです。タスクには、そのようなデータソースからの情報の収集、インデックス作成、フィルタリング、検索、ランク付けなどが含まれます。敵対的情報検索には、そのような操作を検出、分離、無効化する方法の研究が含まれます
ウェブ上では、こうしたデータ操作の最も一般的な形態は検索エンジンスパム(スパムデクシングとも呼ばれる)であり、これは様々な手法を用いてウェブ検索エンジンの活動を妨害し、通常は金銭的利益を得ることを目的としています。スパムデクシングの例としては、リンク爆撃、コメントスパムやリファラースパム、スパムブログ(スプログ)、悪意のあるタグ付けなどが挙げられます。 ランキングアルゴリズムのリバースエンジニアリング、クリック詐欺[1]、ウェブコンテンツフィルタリングなども、敵対的データ操作の一形態とみなされる可能性があります。[2]
トピック
ウェブスパム(スパムデクシング)に関連するトピック:
その他のトピック:
- クリック詐欺検出
- 検索エンジンのランキングアルゴリズムのリバースエンジニアリング
- ウェブコンテンツフィルタリング
- 広告ブロック
- ステルスクローリング
- トロール(インターネット)
- ソーシャルネットワークでの悪意のあるタグ付けや投票
- アストロターフィング
- ソックパペット
歴史
「敵対的情報検索」という用語は、2000年にアンドレイ・ブローダー(当時アルタビスタの主任科学者)によって、 TREC -9会議のウェブ全体会議中に初めて造られました。[3]
参照
参考文献
- ^ Jansen, BJ (2007) クリック詐欺.IEEE Computer. 40(7), 85-86
- ^ B. Davison、M. Najork、T. Converse (2006)、SIGIRワークシートレポート:Web上の敵対的情報検索(AIRWeb 2006)
- ^ D. Hawking and N. Craswell (2004), Very Large Scale Retrieval and Web Search (プレプリント版) 2007年8月29日アーカイブ、Wayback Machine
外部リンク
- AIRWeb:ウェブ上の敵対的情報検索に関するワークショップシリーズ
- Web Spam Challenge: Web Spam検出の研究者のためのコンテスト
- ウェブスパムデータセット: ウェブスパム検出に関する研究用データセット