この記事は読者にとって分かりにくく、または不明瞭な可能性があります。特に、事例ベース推論を技術的な観点から説明していないため、プログラマーが実際にどのように実装しているのか読者は理解しにくいでしょう。( 2021年12月) |
事例ベース推論(CBR)は、広義には、過去の類似した問題の解決策に基づいて新しい問題を解決するプロセスである。[ 1 ] [ 2 ]
日常生活において、類似の症状を示した別の車をリコールしてエンジンを修理する自動車整備士は、事例に基づく推論を用いています。裁判で判例に基づいて特定の結果を主張する弁護士や、判例を作成する裁判官も、事例に基づく推論を用いています。同様に、自然界の仕組みを模倣するエンジニア(バイオミミクリーを実践する)も、自然を問題解決のデータベースとして扱っています。事例に基づく推論は、類推に基づく解決策作成の代表的な手法です。
事例ベース推論は、コンピュータ推論の強力な手法であるだけでなく、人間の日常的な問題解決においても広く普及している、あるいはより過激な言い方をすれば、すべての推論は個人的な過去の経験に基づいている、という主張もある。この見解は、認知科学において最も深く研究されているプロトタイプ理論と関連している。

事例ベース推論は、コンピュータ推論の目的のために4段階のプロセスとして形式化されている:[ 3 ]
一見すると、CBRは機械学習のルール誘導アルゴリズム[注1 ]に似ているように見えるかもしれません。ルール誘導アルゴリズムと同様に、CBRは一連のケースまたはトレーニング例から開始し、取得したケースと対象となる問題との共通点を特定することで、これらの例の一般化(暗黙的ではあるものの)を形成します。[ 4 ]
例えば、プレーンパンケーキの手順をブルーベリーパンケーキにマッピングする場合、同じ基本的な衣と揚げ方を用いることが決定され、その結果、その衣と揚げ方が適用可能な状況の集合が暗黙的に一般化されます。しかし、CBRにおける暗黙的な一般化とルール誘導における一般化の重要な違いは、一般化が行われるタイミングにあります。ルール誘導アルゴリズムは、対象となる問題がまだ分かっていない段階で、一連の訓練例から一般化を導き出します。つまり、積極的一般化(eager generalization)を行います。
例えば、ルール誘導アルゴリズムにプレーンパンケーキ、ダッチアップルパンケーキ、バナナパンケーキのレシピをトレーニング例として与えた場合、トレーニング時には、あらゆる種類のパンケーキを作るための一般的なルールセットを導き出さなければなりません。ブルーベリーパンケーキを焼くというタスクは、テスト時に初めて与えられることになります。ルール誘導アルゴリズムにとって難しいのは、トレーニング例を一般化するためにどのような方向を試みるべきかを予測することです。これは、ケースの一般化をテスト時まで(暗黙的に)遅らせる(遅延一般化の戦略)CBRとは対照的です。パンケーキの例では、CBRにはブルーベリーパンケーキを焼くという目標問題が既に与えられているため、この状況をカバーするために必要なだけケースを一般化できます。したがって、CBRは、ケースを一般化する方法が豊富にある複雑なドメインに適したアプローチになる傾向があります。
法律の世界では、ルールに基づく推論の限界(遅延の制限、将来の状況に関する知識の限界、交渉による合意の限界など)を認識し、CBRを裁判所に明示的に委任することがよくあります。法律におけるCBRと認知的思考に基づくCBRは長らく関連付けられてきましたが、前者はルールに基づく推論と判断のより明確な補間であり、後者は想起とプロセス適応とより密接に結びついています。その違いは、誤りと上訴審における審理に対する姿勢に明確に表れています。
問題解決における事例ベース推論は、症状戦略とも呼ばれます。この戦略では、症状と原因のつながりを確立した過去の経験から得られた、事前の領域知識が必要です。この知識は、浅い知識、蓄積された知識、証拠に基づく知識、履歴に基づく知識、事例に基づく知識などと呼ばれます。これは、専門家による診断に最も関連のある戦略です。問題の診断は、症状が適切な状況カテゴリーを喚起する迅速な認識プロセスとして行われます。[ 5 ]専門家は、以前に類似の事例に遭遇したことがあるため、原因を知っています。事例ベース推論は最も強力な戦略であり、最も一般的に使用されています。ただし、この戦略は、真に新しい問題や、何が起こっているのかをより深く理解する必要がある場合には、単独では機能しません。
問題解決への代替的なアプローチとして、深い推論のカテゴリーに属するトポグラフィック戦略があります。深い推論では、システムに関する深い知識が用いられます。ここでのトポグラフィックとは、構造化された実体の記述または分析、そしてその要素間の関係性を示すことを意味します。[ 6 ]
第一原理からの推論としても知られる深い推論[ 7 ]は、経験に基づくアプローチが実行できない場合に、新しい障害に適用されます。したがって、トポグラフィック戦略は、おそらく第一原理の知識を使用して、システムのより基本的な理解から開発された、事前のドメイン知識にリンクされています。このような知識は、深い知識、因果関係に基づく知識、またはモデルに基づく知識と呼ばれます。[ 8 ] Hoc と Carlier [ 9 ]は、症状はさまざまな用語で定義できるため、症状アプローチはトポグラフィックアプローチによってサポートされる必要がある場合があると指摘しました。逆もまた真であり、浅い推論は、トポグラフィック探索において、帰納的に因果仮説を生成するために使用し、演繹的にそれらの仮説を評価するために使用できます。
CBRの批判者は、CBRは逸話的証拠を主要な動作原理として受け入れるアプローチであると主張します。統計的に関連性のあるデータと暗黙の一般化がなければ、一般化が正しいという保証はありません。しかし、統計的関連性を示すにはデータが不足している場合の帰納的推論はすべて、本質的に逸話的証拠に基づいています。
CBRの起源は、1980年代初頭にイェール大学でロジャー・シャンクとその学生たちが行った研究に遡ります。シャンクの動的記憶モデル[ 10 ]は、初期のCBRシステムであるジャネット・コロドナーのCYRUS [ 11 ]とマイケル・レボウィッツのIPP [ 12 ]の基礎となりました。
1980年代には、CBRの他の学派や密接に関連する分野が登場し、法的推論、メモリベース推論(超並列マシン上で事例から推論を行う方法)、CBRと他の推論手法の組み合わせといったテーマに焦点を当てました。1990年代には、CBRへの関心が国際的に高まり、1995年には国際事例ベース推論会議(ICBR)が設立され、ヨーロッパ、ドイツ、イギリス、イタリアなどの国々でCBRワークショップが開催されました。
CBR技術は、数々の成功したシステムの導入につながっています。最も初期のものは、ロッキード社のCLAVIER [ 13 ]です。これは、工業用対流オーブンで焼成する複合材部品を配置するシステムです。CBRは、コンパック社のSMARTシステム[ 14 ]などのアプリケーションで広く使用されており、健康科学[ 15 ]や構造安全管理などの 主要な応用分野となっています。
近年、統計的枠組みの中でCBRを発展させ、事例ベース推論を確率推論の一種として形式化する研究があります。これにより、一定の信頼度を備えた事例ベース予測が可能になります。[ 16 ] CBRと事例からの帰納法の違いを説明する一つの例として、統計的推論は事例を類似させる傾向を見つけることを目的とするのに対し、CBRは類似性を主張するのに十分なものを符号化することを目的としているという点が挙げられます。[ 17 ]