速くて倹約的な木々

高速かつ簡素な木構造、またはマッチングヒューリスティック[ 1 ] (意思決定研究において)は、一度に1つの質問をすることでオブジェクトを分類するシンプルなグラフィカル構造です。これらの決定木は、心理学人工知能経営科学など、幅広い分野で利用されています。レオ・ブレイマンのCART [ 2 ]などの他の決定木や分類 木とは異なり、高速かつ簡素な木構造は、構築と実行の両方において意図的にシンプルになっており、少ない情報量で高速に動作します。このため、高速かつ簡素な木構造は、リソースが限られたタスクを設計する際に魅力的である可能性があります。[ 3 ]

ローラ・マルティニョン、ヴィトウシュ、タケザワ、フォースターは2003年に初めてこの概念と用語を導入しました。[ 4 ]ゲルト・ギゲレンツァーハーバート・A・サイモンによって作成された正式なモデルに基づいて、他のタスクに対する同様のヒューリスティックが以前に使用されていました。

2 つのオプションと、そのような決定を行うために利用できるm個の手がかり (特徴または属性とも呼ばれる) がある分類タスクでは、FFT は次のように定義されます。

高速かつ簡素なツリーは、最初の m −1 個のキューごとに 1 つの出口があり、最後のキューには 2 つの出口がある、m+1 個の出口を持つ分類ツリーまたは決定ツリーです。

数学的には、高速かつ簡素な木は、辞書式ヒューリスティックス、あるいは非補償的な重みと閾値を持つ線形分類モデルとして捉えることができる。[MKW]その形式的な特性と構成は、2011年にルアン、スクールラー、ギゲレンツァーによって信号検出理論を用いて解析されている。[ 5 ] [LSG]

基本的な構成

工事

基本要素はキューです。キューはランク付けされており、ツリーの各レベルに1つのキューと、各レベルに1つの出口ノードがあります(ただし、ツリーの最終レベルにある最後のキューには2つの出口ノードがあります)。キューが使用されるたびに、そのキューの価値に関する質問が行われます。質問への回答は、すぐに出口につながる場合もあれば、さらなる質問(そして最終的に出口につながる)につながる場合もあります。高速かつ簡素なツリーの特徴的な特性は、各質問に対して、出口につながる可能性のある回答が少なくとも1つ存在することです。

高速かつ簡素な木に関する文献では、(1) 手がかりの順序付けと、(2) 手がかりに関する質問に対するどの回答が出口に直接つながるかを決定するための、様々なアルゴリズムが提案されている[ 4 ] [MKW] [LSG] [ 6 ]。高速かつ簡素な木は、以下の条件が両方とも満たされる場合に完全に定義される。多くの場合、木の構築を単純かつ直感的にするために、アルゴリズムは(1) 手がかりの「良さ」の単純な尺度(例えば、手がかりとカテゴリーの相関関係、各手がかりを他の手がかりとは独立して考慮する)と、(2) 出口に関する単純な選択(例えば、各出口を他の出口とは独立して決定する)を用いるが、より複雑なアルゴリズムも提案されている。

実行

高速で簡素なツリーを使うには、ルートから始めて、一度に1つのキューをチェックします。各ステップで、考えられる結果の1つが出口ノードであり、そこで意思決定(またはアクション)が行われます。出口に到達したら停止し、そうでなければ出口に到達するまで続行します。出口に到達したら停止し、そうでなければ続行して、出口に到達するまでさらに質問を繰り返します。

速くて倹約的なツリーの例
図1. 救急室の医師が患者を通常の看護ベッドに送るべきか、冠動脈疾患集中治療室に送るべきかを判断するのに役立つ、迅速で簡素なツリー(Green & Mehr, 1997)。[GM]

図1は、患者を心臓発作の「高リスク」に分類し、「冠動脈疾患集中治療室」に搬送する必要があるか、「低リスク」に分類し、「一般看護ベッド」に搬送する必要があるかを判断するための簡便な分類ツリーを示している(Green & Mehr, 1997)。[GM]

ジョン、メアリー、ジャックという 3 人の患者について考えてみましょう。

  • ジョンはST セグメントの変化があるため、「高リスク」と分類され、他の兆候を考慮せずに冠動脈ケアユニットに送られます。
  • メアリーはST 部分の変化がなく、主な訴えとして胸痛がありますが、残りの 5 つの要因はいずれも当てはまらないため、3 つの兆候がすべて確認された後、「低リスク」と分類され、通常の介護ベッドに送られます。
  • ジャックはST 部分の変化がなく、主な訴えとして胸痛もないため、これら 2 つの兆候を考慮すると「低リスク」と分類され、通常の看護ベッドに送られます。

パフォーマンス

ラスキーとマルティニョン(2014)の研究では、高速かつ簡素な木の精度と堅牢性はベイズベンチマークに匹敵することが示されています。 [LM]また、高速かつ簡素な木の性能を、ナイーブベイズ、CART、ランダムフォレストロジスティック回帰などの統計学や機械学習で使用される分類アルゴリズムと比較する広範な研究も、数十の実際のデータセットを用いて行われています。[WHM] [MKW] [ 6 ]

信号検出分析

高速かつ簡素な木は、二値分類や二値決定を行うために用いられます。心理学、医学、その他の分野において、信号検出理論(または検出理論)は、このようなタスクを分析するための古典的な理論となっています。

この理論は、事象または人物が2つのカテゴリー(例えば、心臓に問題のある人とない人)に分類されると仮定しています。このうち、私たちにとってより関連性の高いカテゴリーは「シグナル」、もう1つは「ノイズ」と呼ばれます。この2つのカテゴリーは、私たちが「証拠」と呼ぶ観測尺度における分布が異なり、シグナル分布の方が平均値が高くなります。証拠を収集した際に、「シグナル」または「ノイズ」という2つの分類が可能です。この分類から、ヒット(実際にはシグナルであるにもかかわらず「シグナル」と分類する)、正しい拒否(実際にはノイズであるにもかかわらず「ノイズ」と分類する)、ミス(実際にはシグナルであるにもかかわらず「ノイズ」と分類する)、誤報(実際にはノイズであるにもかかわらず「シグナル」と分類する)という4つの結果が考えられます。全体的な精度、つまり分類の期待値を最大化するために、この理論は、証拠尺度における分類基準を慎重に選択し、それを超える基準を「シグナル」と判定し、それ以下の基準を「ノイズ」と判定する必要があると提唱しています。特に、誤報のコストが非常に高い場合(例えば、心臓に問題のある患者を正常と分類するなど)、より低く「寛容な」基準(つまり、証拠尺度で左側)を選択する必要がある一方、誤報のコストが非常に高い場合(例えば、無実の人物を殺人罪で有罪と分類するなど)は、より高く「保守的な」基準を選択する方が適切です。これは、優れた意思決定者は、ほとんどの現実世界の状況において適切なバイアスを持つ必要があることを意味します。これは、分類と意思決定に関する信号検出理論から得られる最も重要かつ関連性の高い洞察です。

高速で節約的なツリーの例2
図 2. 図の上部には、バイナリ決定タスクにおける信号検出理論の仮定が示されています。3 本の垂直線は、エージェントと意思決定者が採用する可能性のある 3 つの決定基準を表しています。下部には、3 つの特徴を固定順序で参照した場合に構築できる 4 つの FFT が示されています。最初の 2 つの出口によって示される分類に基づいて、ツリーは左から右に FFTss、FFTsn、FFTns、FFTnn と名付けられています。図の各部分を結ぶ矢印は、バイナリ s/n (それぞれ信号とノイズ) 分類または決定を行うために使用される 4 つの FFT 決定基準のおおよその位置を示しています。4 つのうち、FFTss は最も自由な決定基準を持ち、FFTnn は最も保守的な決定基準を持ちます。FFTsn と FFTns の決定基準は他の 2 つほど極端ではなく、FFTsn は FFTns よりも自由です。

2011年、Luan、Schooler、およびGigerenzerは、信号検出理論の観点から高速かつ簡素な木の特性を分析しました。この分析からいくつかの重要な知見が得られました。まず、高速かつ簡素な木の出口構造の選択は、信号検出における決定基準の設定に対応しています。簡単に言えば、高速かつ簡素な木において「信号出口」が早く現れるほど、その木のバイアスはよりリベラルになります。2つの高速かつ簡素な木の相対的なバイアスは、2つの木が異なる最初の出口によって決定され、「信号出口」(「s」で示される)を持つ木は、「ノイズ出口」(「n」で示される)を持つ木よりも常にリベラルになります(図2)。例えば、FFTsnnn(ここでもs = 「信号出口」、n = 「ノイズ出口」)は、FFTnsssよりもリベラルなバイアスになります。この原理は、高速かつ簡素なツリーの「辞書式決定バイアス」と呼ばれます。

第二に、一連のシミュレーションにより、異なる出口構造を持つ高速・簡素な木は、誤報と誤報の結果が異なる場合、意思決定の期待値が異なる、時には大幅に異なる結果をもたらすことが示されています。したがって、高速・簡素な木を構築して適用する際には、タスクの意思決定の利得構造とよく一致する出口構造を選択する必要があります。

3 番目に、高速かつ簡素なツリーの全体的な感度 (つまり、ツリーが信号とノイズをどれだけ正確に識別できるか、信号検出理論の d' または A' で測定できる) は、キューの感度の平均と分散、キュー間のキュー相関など、ツリーを構成するキューの特性によって影響を受けますが、ツリーの出口構造によってはあまり影響を受けません。そして最後に、高速かつ簡素なツリーのパフォーマンスは堅牢で、信号検出理論で開発された、理想観察者分析モデルや最適逐次サンプリング モデルなどの、はるかに洗練された決定アルゴリズムに匹敵します。サンプル外予測のコンテキストでは、学習サンプル サイズが比較的小さい場合 (例: 80 試行未満)、高速かつ簡素なツリーは他のモデルと比較して最高のパフォーマンスを発揮します。

高速で節約的なツリーの例3
図3. アフガニスタン駐留兵士が検問所に近づいてくる車が民間人か自爆テロ犯の可能性があるかを見分けるのに役立つ、迅速で簡素なツリー(Keller & Katsikopoulos, 2016)。[KK]
高速で節約的なツリーの例4
図4. 社会的な交流の中で他人が犯した罪を許すかどうかを決定する方法を説明するファスト・アンド・フルガル・ツリー(左:Tan, Luan, & Katsikopoulos, 2017)[TLK] と、英国の裁判官が懲罰的保釈決定を下すかどうかを決定する方法(右:Dhami, 2003)。[D]

コンピューティングサポート

2017年に、Phillips、Neth、Woike、Gaissmaier [PNWG]は、CRANでホストされているRパッケージFFTrees [ 7 ](付属アプリ[ 8 ]付き)を発表しました。これは、ユーザーフレンドリーな方法で、高速で質素なツリーを構築し、グラフィカルに描画し、定量的に評価します。

その他の例

高速かつ倹約的なツリーは、意思決定の方法の規定と、人々が実際に意思決定を行う方法の記述の両方において、数多く応用されてきました。医療分野以外では、規定的な応用例として、アフガニスタンに駐留する兵士に、検問所に近づいてくる車が民間人か自爆テロリストの運転なのかを見分ける方法を指導することが挙げられます。[ 9 ] [KK]このツリーは図 3 に示されています。高速かつ倹約的なツリーの記述的使用例を 2 つ、図 4 に示します。左側のツリーと右側のツリーはそれぞれ、ある人が社交の場で犯した犯罪を許すかどうかを決定する方法[TLK]と、英国の裁判官が保釈か投獄かの決定を下す方法を説明しています。[D]一般に、高速かつ倹約的なツリーは、複数の手がかりが関係するあらゆる二者択一の意思決定プロセスを支援またはモデル化するために適用できます。

GM。
Green and Mehr, 1997 Green, L., & Mehr, DR (1997). 医師の冠動脈疾患集中治療室への入院決定に影響を与える要因は何か? The Journal of Family Practice, 45(3), 219–226.
MH。
ダ。
DH。
FZBM。
MKW。
D.
Dhami, MK (2003). 専門職における意思決定の心理モデル. 心理科学, 14, 175–180.
LSG。
Luan、Schooler、Gigerenzer、2011「高速かつ簡素なツリーの信号検出分析」
LM。
KK。
TLK。
Tan, JH, Luan, S, Katsikopoulos, KV (2017). シグナル検出アプローチによる許しの意思決定のモデル化. 進化と人間の行動, 38, 21–38.
WHM。
PNWG。

参考文献

  1. ^ Gigerenzer, G. ; Gaissmaier, W. (2011). 「ヒューリスティックな意思決定」 . Annual Review of Psychology . 62 : 451–482 . doi : 10.1146/annurev-psych-120709-145346 . hdl : 11858/00-001M-0000-0024-F16D-5 . PMID  21126183. 2024年5月6日閲覧. [A] 高速かつ簡素なツリー(「マッチングヒューリスティック」)[.]
  2. ^ Leo Breiman (2017).分類と回帰木. Routledge. doi : 10.1201/9781315139470 . ISBN 9781315139470. S2CID  129307201 . 2019年8月30日閲覧.
  3. ^ Martignon, Laura F.; Katsikopoulos, Konstantinos V.; Woike, Jan K. (2012)、「Naïve, Fast, and Frugal Trees for Classification」Ecological Rationality、Oxford University Press、doi : 10.1093/acprof:oso/9780195315448.001.0001ISBN 978-0-19-531544-8、 2022年2月28日取得{{citation}}: CS1 maint: ISBNによる作業パラメータ(リンク
  4. ^ a bローラ・マルティニョン、オリバー・ヴィトーシュ、竹澤正則、マルコム・フォースター。「素朴でありながら啓発的:自然周波数から高速で質素な意思決定ツリーへ」、『思考:推論、判断、意思決定に関する心理学的視点』(デイヴィッド・ハードマン、ローラ・マッキ編)、チチェスター:ジョン・ワイリー・アンド・サンズ、2003年。
  5. ^ Luan、Schooler、Gigerenzer、2011高速かつ簡素なツリーの信号検出分析。
  6. ^ a b Şimşek, Özgür; Buckmann, Marcus (2015), Cortes, C.; Lawrence, ND; Lee, DD; Sugiyama, M. (eds.), "Learning From Small Samples: An Analysis of Simple Decision Heuristics" (PDF) , Advances in Neural Information Processing Systems 28 , Curran Associates, Inc., pp.  3159– 3167 , 2019年9月1日取得
  7. ^ 「FFTrees: 高速で効率的な決定木を生成、視覚化、評価する」 2023年6月5日。
  8. ^ 「Shiny FFTrees」 . econpsychbasel.shinyapps.io .
  9. ^ Keller, N.; Katsikopoulos, KV (2016年3月16日). 「オペレーションズ・リサーチにおける心理的ヒューリスティックスの役割と軍事安定化作戦における実証」 . European Journal of Operational Research . 249 (3). Elsevier: 1063– 1073. doi : 10.1016/j.ejor.2015.07.023 . 2025年10月18日閲覧