敵対的情報検索

データセットにおける情報検索戦略

敵対的情報検索（AR）は、情報検索におけるトピックの一つであり、悪意を持って操作されたデータソースを扱う戦略に関するものです。タスクには、そのようなデータソースからの情報の収集、インデックス作成、フィルタリング、検索、ランク付けなどが含まれます。敵対的情報検索には、そのような操作を検出、分離、無効化する方法の研究が含まれます

ウェブ上では、こうしたデータ操作の最も一般的な形態は検索エンジンスパム（スパムデクシングとも呼ばれる）であり、これは様々な手法を用いてウェブ検索エンジンの活動を妨害し、通常は金銭的利益を得ることを目的としています。スパムデクシングの例としては、リンク爆撃、コメントスパムやリファラースパム、スパムブログ（スプログ）、悪意のあるタグ付けなどが挙げられます。ランキングアルゴリズムのリバースエンジニアリング、クリック詐欺^[1]、ウェブコンテンツフィルタリングなども、敵対的データ操作の一形態とみなされる可能性があります。^[2]

トピック

ウェブスパム（スパムデクシング）に関連するトピック：

リンクスパム
キーワードスパム
クローキング
悪意のあるタグ付け
コメントスパム、スプログ、pingスパムなど、ブログ関連のスパム

その他のトピック：

歴史

「敵対的情報検索」という用語は、2000年にアンドレイ・ブローダー（当時アルタビスタの主任科学者）によって、 TREC -9会議のウェブ全体会議中に初めて造られました。^[3]

参照

参考文献

^ Jansen, BJ (2007) クリック詐欺．IEEE Computer. 40(7), 85-86
^ B. Davison、M. Najork、T. Converse (2006)、SIGIRワークシートレポート：Web上の敵対的情報検索（AIRWeb 2006）
^ D. Hawking and N. Craswell (2004), Very Large Scale Retrieval and Web Search (プレプリント版) 2007年8月29日アーカイブ、Wayback Machine

外部リンク

AIRWeb：ウェブ上の敵対的情報検索に関するワークショップシリーズ
Web Spam Challenge: Web Spam検出の研究者のためのコンテスト
ウェブスパムデータセット: ウェブスパム検出に関する研究用データセット

「https://en.wikipedia.org/w/index.php?title=Adversarial_information_retrieval&oldid=1185327232」より取得