証拠に基づく意思決定理論

意思決定理論における学派

証拠に基づく意思決定理論(EDT)は、意思決定理論の一派であり、合理的な主体が一連の行動の可能性に直面した場合、最もニュースバリューの高い行動、すなわち、その行動が取られたという「ニュース」を受け取った場合に期待される最良の結果を示す行動を選択すべきであると提唱する。言い換えれば、「自分が何をするかを最も知りたいと思う行動を取る」ことを推奨する。[1] : 7 

EDTは、因果的に最良の結果をもたらす行動をとることを推奨する因果決定理論(CDT)とは対照的です。この2つの理論は多くの場合一致しますが、特定の哲学的思考実験では異なる結論を示します。例えば、ニューカムのパラドックスにおいて、EDTは片方の箱だけを取ることを推奨しますが、CDTは両方の箱を取ることを推奨します。[1] : 22–26 

正式な説明

1976年の論文で、アラン・ギバードとウィリアム・ハーパーは2種類の期待効用最大化を区別しました。EDTは、 条件付き確率を用いて計算された行動の期待効用を最大化することを提案しています。

V j P j | D j {\displaystyle V(A)=\sum \limits _{j}P(O_{j}|A)D(O_{j}),}

ここで、は結果の望ましさであり、は行動が起こった場合の条件付き確率である[2]これは因果決定理論で使用される期待効用の反事実的定式化とは対照的である。 D j {\displaystyle D(O_{j})} j {\displaystyle O_{j}} P j | {\displaystyle P(O_{j}|A)} j {\displaystyle O_{j}} {\displaystyle A}

あなた j P j D j {\displaystyle U(A)=\sum \limits _{j}P(A\mathrel {\Box {\rightarrow }} O_{j})D(O_{j}),}

ここで、式は、行動が実行される反事実的状況における結果の確率を示すとは常に等しいとは限らないため、これらの期待効用に関する定式化は同等ではなく、[2] EDTとCDTによって規定される行動に違いが生じる。 P j {\displaystyle P(A\mathrel {\Box {\rightarrow }} O_{j})} j {\displaystyle O_{j}} {\displaystyle A} P j {\displaystyle P(A\mathrel {\Box {\rightarrow }} O_{j})} P j | {\displaystyle P(O_{j}|A)}

思考実験

さまざまな意思決定理論は、さまざまな思考実験における行動の推奨において検討されることが多い

ニューカムのパラドックス

ニューカムのパラドックスでは、予測者、プレイヤー、そしてAとBという2つの箱が存在します。予測者はプレイヤーの選択を、例えば99%の精度で確実に予測できます。プレイヤーは箱Bだけを取るか、箱AとBの両方を取るかという選択肢を与えられます。プレイヤーは以下のことを知っています。[3]

  • ボックス A は透明で、常に 1,000 ドルが目に見える形で入っています。
  • ボックス B は不透明で、その内容は予測子によってすでに設定されています。
    • 予測者がプレイヤーがボックス A とボックス B の両方を取ると予測した場合、ボックス B には何も入りません。
    • 予測者がプレイヤーがボックス B のみを取ると予測した場合、ボックス B には 1,000,000 ドルが入っています。

プレイヤーは、予測者が何を予測したか、また箱Bに何が入っているかは知らないまま選択をします。プレイヤーは両方の箱を取るべきでしょうか、それとも箱Bだけを取るべきでしょうか?

証拠決定理論によれば、このシナリオでは箱Bのみを取ることが推奨されます。なぜなら、箱Bのみを取ることは、予測者がプレイヤーが箱Bのみを取ると予想していたことの強力な証拠であり、したがって箱Bには100万ドルが入っている可能性が非常に高いからです。逆に、両方の箱を取ることを選択したことは、予測者がプレイヤーが両方の箱を取ることを知っていたことの強力な証拠であり、したがって箱Bには何も入っていないと予想すべきです。[1] : 22 

逆に、因果決定理論(CDT) では、その時点で予測者がすでに予測を行っているため (したがって、プレイヤーの行動は結果に影響を与えません)、プレイヤーが両方のボックスを取ることを推奨します。

正式には、EDTの期待効用は

V Bのみを取る P ボックスBに1M | Bのみを取る × $ 1 000 000 + P ボックスBには何も入っていない | Bのみを取る × $ 0 0.99 × $ 1 000 000 + 0.01 × $ 0 $ 990 000 V 両方の箱を取る P ボックスBに1M | 両方の箱を取る × $ 1 001 000 + P ボックスBには何も入っていない | 両方の箱を取る × $ 1 000 0.01 × $ 1 001 000 + 0.99 × $ 1 000 $ 11 000 {\displaystyle {\begin{aligned}V({\text{箱Bのみを取る}})&=P({\text{箱Bに1Mが入っている}}|{\text{箱Bのみを取る}})\times \$1,000,000+P({\text{箱Bに何も入っていない}}|{\text{箱Bのみを取る}})\times \$0\\&=0.99\times \$1,000,000+0.01\times \$0=\$990,000\\V({\text{両方の箱を取る}})&=P({\text{箱Bに1Mが入っている}}|{\text{両方の箱を取る}})\times \$1,001,000+P({\text{箱Bに何も入っていない}}|{\text{両方の箱を取る}})\times \$1,000\\&=0.01\times \$1,001,000+0.99\times \$1,000=\$11,000\end{aligned}}}

なので、EDT はボックス B のみを取ることを推奨しています。 V Bのみを取る > V 両方の箱を取る {\displaystyle V({\text{Bのみ取る}})>V({\text{両方の箱を取る}})}

双子の囚人のジレンマ

囚人のジレンマの思考実験のこのバリエーションでは、行為者は、推論のプロセスが自分とまったく同じ心理的な双子の相手に対して協力するか裏切るかを選択しなければなりません。

青豆と心理的な双子は別々の部屋に入れられ、意思疎通はできない。二人とも協力すれば、それぞれ5ドルを得る。二人とも裏切れば、それぞれ1ドルを得る。一方が協力し、もう一方が裏切れば、一方は10ドル、もう一方は0ドルを得る。青豆が自分の利益だけを気にしていると仮定すると、彼女はどうすべきだろうか?[4]

証拠決定理論は、この状況では協力を推奨する。なぜなら、青豆が協力するという決定は、彼女の心理的双子も協力するという強力な証拠であり、期待される利得は5ドルだからである。一方、青豆が裏切った場合、これは彼女の心理的双子も裏切るという強力な証拠となり、期待される利得は1ドルとなる。正式には、期待効用は

V 青豆は協力する P 双子が協力する | 青豆は協力する × $ 5 + P 双子の欠陥 | 青豆は協力する × $ 0 1 × $ 5 + 0 × $ 0 $ 5 V 青豆の欠陥 P 双子が協力する | 青豆の欠陥 × $ 10 + P 双子の欠陥 | 青豆の欠陥 × $ 1 0 × $ 10 + 1 × $ 1 $ 1. {\displaystyle {\begin{aligned}V({\text{青豆が協力する}})&=P({\text{双子が協力する}}|{\text{青豆が協力する}})\times \$5+P({\text{双子の欠陥}}|{\text{青豆が協力する}})\times \$0\\&=1\times \$5+0\times \$0=\$5\\V({\text{青豆の欠陥}})&=P({\text{双子が協力する}}|{\text{青豆の欠陥}})\times \$10+P({\text{双子の欠陥}}|{\text{青豆の欠陥}})\times \$1\\&=0\times \$10+1\times \$1=\$1.\end{aligned}}}

以来、EDT は協力することを推奨しています。 V 青豆は協力する > V 青豆の欠陥 {\displaystyle V({\text{青豆が協力する}})>V({\text{青豆が裏切る}})}

眠れる森の美女問題

証拠決定理論は、眠れる森の美女問題にオランダ書論争を回避するために適用されてきた。眠れる森の美女は、コイン投げの半分が表になるという確信度を与えた場合、オランダ書の影響を受けるが、証拠決定理論を適用することでこれを回避できると主張されてきた。しかし、ヴィンセント・コニツァーは、証拠決定理論を適用した後でも、半分の確率を持つ人は依然としてオランダ書の影響を受けると主張している。[5]

その他の支持論拠

たとえ証拠に基づく意思決定理論への信頼度が低いとしても、証拠に基づく意思決定理論が真実であるかのように行動することは合理的であるかもしれない。つまり、証拠に基づく意思決定理論は多くの相関する意思決定者の行動を伴う可能性があるため、その利害は因果に基づく意思決定理論よりも高く、優先される可能性がある。[6]

批判

デイヴィッド・ルイスは、証拠に基づく意思決定理論を「ニュースを管理する非合理的な方針」を推進するものと特徴づけている。[7] ジェームズ・M・ジョイスは、「合理的な行為者は、その縁起の良さではなく、因果的な効力に基づいて行為を選択する。彼らは、たとえそれが悪い知らせを意味する可能性がある場合でも、良い結果をもたらすように行動する」と主張した。[8]

参照

参考文献

  1. ^ abc Ahmed, Arif (2021).証拠に基づく意思決定理論. ケンブリッジ大学出版局. ISBN 9781108607865
  2. ^ ab ギバード、A.; ハーパー、WL (1976)、「反事実と2種類の期待効用」(PDF)、pp.  7– 8
  3. ^ Wolpert, DH; Benford, G. (2013年6月). 「ニューカムのパラドックスの教訓」. Synthese . 190 (9): 1637– 1646. doi :10.1007/s11229-011-9899-3. JSTOR  41931515. S2CID  113227.
  4. ^ Greene, P.; Levinstein, B. (2020). 「フリーライドのない行為帰結主義」. Philosophical Perspectives . 34 (1): 100– 101. doi :10.1111/phpe.12138. S2CID  211161349.
  5. ^ Conitzer, Vincent (2015). 「証拠に基づく意思決定理論家である眠れる美女たちに対するオランダの書」Synthese . 192. Springer Netherlands. arXiv : 1705.03560 . doi :10.1007/s11229-015-0691-7 . 2025年7月4日閲覧
  6. ^ ウィリアム・マカスキル;ヴァリンダー、アーロン。エスターヘルド、カスパール。シュルマン、カール。ヨハネス・トロイトレーン (2021)、『証拠主義者の賭け』(PDF)
  7. ^ Lewis, D. (1981)、「因果決定理論」(PDF)オーストララシアン哲学ジャーナル59(1):5– 30、doi:10.1080/00048408112340011 2009年5月29日閲覧。
  8. ^ ジョイス、JM(1999)、因果決定理論の基礎、146ページ
「https://en.wikipedia.org/w/index.php?title=Evidential_decision_theory&oldid=1306528927」より取得