分類器チェーン

分類器連鎖は、マルチラベル分類における問題変換のための機械学習手法です。二項関連性法の計算効率と、分類におけるラベルの依存性を考慮した上で、高い精度を実現しています[1]

問題の変換

問題変換法はいくつか存在する。その1つにバイナリ関連性法(BR)がある。ラベル集合と、形式のインスタンスを含むデータセットが与えられる。ここで、特徴ベクトルはインスタンスに割り当てられたラベル集合である。BRはデータセットをデータセットに変換し、各ラベルの バイナリ分類器を学習する。このプロセス中、ラベル間の依存関係に関する情報は保持されない。そのため、データセット内でラベルが共起することは決してないにもかかわらず、インスタンスにラベル集合が割り当てられる状況が発生する可能性がある。したがって、ラベルの共起に関する情報は、正しいラベルの組み合わせを割り当てるのに役立つ可能性がある。この情報が失われると、分類性能が低下する場合がある。[2] L {\displaystyle {\mathit {L}}\,} × はい {\displaystyle {\mathit {(x,Y)}}\,} × {\displaystyle {\mathit {x}}\,} はい L {\displaystyle Y\subseteq L} | L | {\displaystyle \left\vert L\right\vert } | L | {\displaystyle \left\vert L\right\vert } H : X { l ¬ l } {\displaystyle H:X\rightarrow \{l,\neg l\}} l L {\displaystyle l\in L}

ラベルの相関関係を考慮する別のアプローチとして、ラベル・パワーセット法(LP)があります。データセット内のラベルの各組み合わせは、単一のラベルとみなされます。変換後、単一ラベル分類器が学習されます。ここで、はデータセット内のすべてのラベルのパワーセットです。このアプローチの主な欠点は、ラベルの組み合わせの数がラベルの数に応じて指数関数的に増加することです。例えば、10個のラベルを持つマルチラベルデータセットでは、最大でラベルの組み合わせが 個になる可能性があります。これにより、分類の実行時間が長くなります。 H : X P L {\displaystyle H:X\rightarrow {\mathcal {P}}(L)} P L {\displaystyle {\mathcal {P}}(L)} L {\displaystyle {\mathit {L}}} 2 10 1024 {\displaystyle 2^{10}=1024}

分類器チェーン法はBR法に基づいており、多数のラベルに対しても効率的です。さらに、ラベル間の依存関係も考慮します。

方法の説明

与えられたラベルセットに対して、分類器チェーンモデル(CC)は、バイナリ関連性法と同様に分類器を学習します。すべての分類器は、特徴空間を通じてチェーン状にリンクされています。 L {\displaystyle {\mathit {L}}\,} | L | {\displaystyle \left\vert L\right\vert }

データセットにおいて、 -番目のインスタンスがはラベルのサブセット)の形式を持つ場合、は特徴量の集合です。データセットは、 -番目のデータセットのインスタンスが ()の形式を持つ データセットに変換されます。-番目のラベルがインスタンスに割り当てられている場合、それ以外の場合は です。このように、分類器はそれぞれが単一のラベルの2値分類を学習する連鎖を構築します。各分類器に与えられた特徴量は、インスタンスに以前のどのラベルが割り当てられたかを示す2値で拡張されます。 {\displaystyle i} × はい {\displaystyle {\mathit {(x_{i},Y_{i})}}\,} はい {\displaystyle {\mathit {Y_{i}}}\,} × {\displaystyle {\mathit {x_{i}}}\,} | L | {\displaystyle \left\vert L\right\vert } j {\displaystyle j} × l 1 l j 1 l j l j { 0 1 } {\displaystyle ((x_{i},l_{1},...,l_{j-1}),l_{j}),l_{j}\in \{0,1\}} j {\displaystyle j} l j {\displaystyle {\mathit {l_{j}}}\,} 1 {\displaystyle 1} 0 {\displaystyle 0}

新しいインスタンスを分類することで、分類器の連鎖を構築し、ラベルを再び予測します。分類は最初の分類器から始まり、特徴空間を介して分類器間でラベル情報を渡すことで、最後の分類器へと進みます。したがって、ラベル間の依存関係は保持されます。ただし、連鎖の順序によって結果は異なる場合があります。例えば、あるラベルが他のラベルと頻繁に共起する場合、連鎖内で後続するラベルのインスタンスのみが、その特徴ベクトルにおいて他のラベルに関する情報を持ちます。この問題を解決し、精度を向上させるために、分類器のアンサンブルを使用することができます。 [3] C 1 {\displaystyle {\mathit {C_{1}}}\,} C | L | {\displaystyle {\mathit {C_{|L|}}}\,}

アンサンブル分類器連鎖(ECC)では、ランダムなデータセットのサブセットを用いて、複数のCC分類器をランダムな連鎖順序(つまりラベル順序)で学習させることができます。新しいインスタンスのラベルは、各分類器によって個別に予測されます。その後、各ラベルの予測数、つまり「投票数」が集計されます。ある閾値よりも高い割合の分類器によって予測された場合、そのラベルは受け入れられます。

適応

また、回帰チェーンも存在します。チェーンの順序によって時間的順序が確実に尊重される場合、 回帰チェーン自体はベクトル自己回帰モデルに似ている可能性があります。

参考文献

  1. ^ Read, Jesse; Bernhard Pfahringer; Geoff Holmes; Eibe Frank (2009). 「マルチラベル分類のための分類器チェーン」(PDF) . Proc 13th European Conference on Principles and Practice of Knowledge Discovery in Databases and 20th European Conference on Machine Learning . 2009 .
  2. ^ Dembczynski, Krzysztof; Willem Waegeman; Weiwei Cheng; Eyke Hüllermeier (2010). 「マルチラベル分類におけるラベル依存性について」(PDF) .マルチラベルデータからの学習ワークショップ議事録. 2010 : 5–12 .
  3. ^ Rokach, Lior (2010). 「アンサンブルベース分類器」(PDF) . Artif. Intell. Rev. 33 ( 1– 2 ). Norwell, MA, USA: ACM: 1– 39. doi :10.1007/s10462-009-9124-7.
  • マルチラベル分類のためのより優れた分類器チェーン Jesse Read と Fernando Pérez Cruz による分類器チェーンに関するプレゼンテーション
「https://en.wikipedia.org/w/index.php?title=Classifier_chains&oldid=1318383188」から取得