K 最適パターン検出は、ほとんどの関連ルール学習手法の基礎となる頻繁なパターン検出アプローチの代替手段を提供するデータ マイニング手法です。
頻出パターン発見手法は、サンプルデータ中に十分に頻出する例が存在するすべてのパターンを発見します。一方、k最適パターン発見手法は、ユーザーが指定した関心指標を最適化するk個のパターンを発見します。パラメータkもユーザーが指定します。
k 最適パターン発見手法の例には次のようなものがあります。
- k最適分類ルールの発見。[1]
- k最適サブグループ発見[2]
- シーケンシャルサンプリングを用いてk個の最も興味深いパターンを見つける。[3]
- 最小サポートなしでtop.kの頻繁な閉じたパターンをマイニングする。[4]
- k最適ルール発見[5]
k最適ルール発見や頻出パターンマイニング技術とは対照的に、サブグループ発見は、特定の対象特性に関する興味深いパターンのマイニングに焦点を当てています。これには、例えば、2値、名義、数値属性[6]が含まれますが、複数の変数間の相関関係など、より複雑な対象概念も含まれます。制約やオントロジー関係などの背景知識[7]は、発見結果の焦点を絞り込み、改善するために効果的に適用できる場合が多くあります。
参考文献
- ^ Webb, GI (1995). OPUS: 非順序探索のための効率的な許容アルゴリズム.人工知能研究ジャーナル, 3, 431-465.
- ^ Wrobel, Stefan (1997) 「サブグループの多重関係発見のためのアルゴリズム」Proceedings First European Symposium on Principles of Data Mining and Knowledge Discovery . Springer.
- ^ Scheffer, T., & Wrobel, S. (2002). シーケンシャルサンプリングを用いたデータベース内における最も興味深いパターンの迅速な発見. Journal of Machine Learning Research , 3, 833-862.
- ^ Han, J., Wang, J., Lu, Y., Tzvetkov, P. (2002) 最小サポートなしの上位k個の頻出閉パターンのマイニング.国際データマイニング会議論文集,pp. 211-218.
- ^ Webb, GI, Zhang, S. (2005). K最適ルール発見.データマイニングと知識発見, 10(1), 39-79.
- ^ Kloesgen, W. (1996). 「EXPLORA: マルチパターン・マルチ戦略発見アシスタント」. 『知識発見とデータマイニングの進歩』 pp. 249– 271. 2021年4月14日閲覧。
- ^ Atzmueller, Martin; Puppe, Frank; Buscher, Hans-Peter (2005年8月1日). 「知識集約型サブグループ発見のための背景知識の活用」(PDF) .第19回人工知能国際合同会議議事録. Morgan Kaufmann Publishers. 647– 652ページ .
外部リンク
- 「データサイエンスの最先端をお届けします」。データサイエンスの最先端をお届けします。2017年5月6日。 2021年4月14日閲覧。
- Atzmueller, Martin (2015-05-17). 「VIKAMINE:サブグループの発見と分析」. VIKAMINE . 2021年4月14日閲覧。