機械学習において、インスタンスベース学習(メモリベース学習[1]と呼ばれることもある)は、明示的な一般化を行う代わりに、新しい問題インスタンスを、メモリに保存されている訓練で見られたインスタンスと比較する学習アルゴリズムの一種です。新しいインスタンスが観測されるまで計算が延期されるため、これらのアルゴリズムは「遅延学習」と呼ばれることもあります。[2]
インスタンスベース学習は、訓練インスタンス自体から直接仮説を構築するため、インスタンスベースと呼ばれます。[3] これは、仮説の複雑さがデータの増加に伴って増大する可能性があることを意味します。[3]最悪の場合、仮説はn個の訓練項目のリストとなり、単一の新しいインスタンスを分類するための計算量はO ( n )となります。インスタンスベース学習が他の機械学習手法に対して持つ利点の一つは、モデルをこれまでに見たことのないデータに適応させることができることです。インスタンスベース学習者は、単に新しいインスタンスを保存したり、古いインスタンスを破棄したりするだけで済みます。
インスタンスベース学習アルゴリズムの例としては、k近傍法、カーネルマシン、RBFネットワークなどがあります。[2] :ch. 8 これらはトレーニングセット(のサブセット)を保存し、新しいインスタンスの値/クラスを予測する際に、このインスタンスとトレーニングインスタンス間の距離または類似度を計算して決定を下します。
すべてのトレーニングインスタンスを保存する際のメモリの複雑さ、およびトレーニングセット内のノイズへの過剰適合のリスクに対処するために、インスタンス削減アルゴリズムが提案されています。[4]
参照
参考文献
- ^ Walter Daelemans、Antal van den Bosch (2005). Memory-Based Language Processing . Cambridge University Press.
- ^ Tom Mitchell (1997). Machine Learning . McGraw-Hill
- ^ ab Stuart Russell and Peter Norvig (2003). Artificial Intelligence: A Modern Approach , second edition, p. 733. Prentice Hall. ISBN 0-13-080302-2
- ^ D. Randall Wilson; Tony R. Martinez (2000). "Reduction techniques for instance-based learning algorithms". Machine Learning .