重複係数

セット間の類似度測定

重なり係数[1]またはシムキエヴィチ・シンプソン係数[要出典] [3] [4] [5]は、 2つの有限集合間の重なり具合を測る類似度指標である。これはジャカード指数と関連しており、交差部分の大きさを2つの集合のうち小さい方の大きさで割ったものとして定義される。

重複 B | B | | | | B | {\displaystyle \operatorname {overlap} (A,B)={\frac {|A\cap B|}{\min(|A|,|B|)}}}

注意してください。集合Aが集合Bサブセットである場合、またはその逆の場合、重複係数は1になります。 0 重複 B 1 {\displaystyle 0\leq \operatorname {重複} (A,B)\leq 1}

参照

注記

  1. ^ 「重複」という用語の使用は、McGill et al . (1979) [1]の表2の式27のコメントに見られ、 Sager & Lockemann (1976) [2]を参照している。

参考文献

  1. ^ McGill, M.; Koll, M.; Noreault, T. (1979年10月). 情報検索システムによる文書ランキングに影響を与える要因の評価, シラキュース, ニューヨーク州: シラキュース大学情報学部.
  2. ^ Sager, WKH; Lockemann, PC (1976). 「ランキングアルゴリズムの分類」.国際情報・ドキュメンテーションフォーラム. 1 (4): 12–25.
  3. ^ シンプソン、GG(1943年1月)「哺乳類と大陸の性質」アメリカ科学誌241 ( 1):1–31。
  4. ^ シンプソン、GG(1947年7月)「新生代における全北区哺乳類動物相と大陸関係」アメリカ地質学会誌58 (7):613–688。
  5. ^ シンプソン, GG (1960). 「動物相の類似性の測定に関するノート」.アメリカ科学誌. 258-A : 300–311.
「https://en.wikipedia.org/w/index.php?title=Overlap_coefficient&oldid=1316201076」より取得