敵対的情報検索

データセットにおける情報検索戦略

敵対的情報検索AR)は、情報検索におけるトピックの一つであり、悪意を持って操作されたデータソースを扱う戦略に関するものです。タスクには、そのようなデータソースからの情報の収集、インデックス作成、フィルタリング、検索、ランク付けなどが含まれます。敵対的情報検索には、そのような操作を検出、分離、無効化する方法の研究が含まれます

ウェブ上では、こうしたデータ操作の最も一般的な形態は検索エンジンスパム(スパムデクシングとも呼ばれる)であり、これは様々な手法を用いてウェブ検索エンジンの活動を妨害し、通常は金銭的利益を得ることを目的としています。スパムデクシングの例としては、リンク爆撃コメントスパムリファラースパムスパムブログ(スプログ)、悪意のあるタグ付けなどが挙げられます。 ランキングアルゴリズムリバースエンジニアリングクリック詐欺[1]ウェブコンテンツフィルタリングなども、敵対的データ操作の一形態とみなされる可能性があります[2]

トピック

ウェブスパム(スパムデクシング)に関連するトピック:

その他のトピック:

歴史

「敵対的情報検索」という用語は、2000年にアンドレイ・ブローダー(当時アルタビスタの主任科学者)によって、 TREC -9会議のウェブ全体会議中に初めて造られました[3]

参照

参考文献

  1. ^ Jansen, BJ (2007) クリック詐欺.IEEE Computer. 40(7), 85-86
  2. ^ B. Davison、M. Najork、T. Converse (2006)、SIGIRワークシートレポート:Web上の敵対的情報検索(AIRWeb 2006)
  3. ^ D. Hawking and N. Craswell (2004), Very Large Scale Retrieval and Web Search (プレプ​​リント版) 2007年8月29日アーカイブ、Wayback Machine
  • AIRWeb:ウェブ上の敵対的情報検索に関するワークショップシリーズ
  • Web Spam Challenge: Web Spam検出の研究者のためのコンテスト
  • ウェブスパムデータセット: ウェブスパム検出に関する研究用データセット
「https://en.wikipedia.org/w/index.php?title=Adversarial_information_retrieval&oldid=1185327232」より取得