効用評価[1](効用測定[2]とも呼ばれる)は、個人または集団の効用関数を推定するプロセスである。効用評価には様々な手法がある。[3]
単一属性効用関数の評価
単一属性効用関数は、人が保有する(または得る)金額を、そこから得られる主観的満足度を表す数値にマッピングします。効用関数を定義する動機は、サンクトペテルブルクのパラドックスに由来します。これは、期待される金銭的利益が無限大であっても、人々は宝くじに多額のお金を払いたがらないという観察です。ダニエル・ベルヌーイとガブリエル・クレイマーによって提唱されたこのパラドックスの古典的な解決策は、ほとんどの人の効用関数が厳密に凹型であり、期待利益ではなく期待効用を最大化することを目指すというものです。
電力ログユーティリティ
ベルヌーイ自身は効用が対数関数、すなわちu( x )=log( x )(xは金額)であると仮定し、これはサンクトペテルブルクのパラドックスを解決するのに十分であった。グスタフ・フェヒナー[4]もまた、対数関数(ウェーバー・フェヒナーの法則として知られる)の心理物理学的根拠を示した。しかし、スタンレー・スミス・スティーブンス[5]は、物理的刺激と心理的知覚の関係はべき関数、すなわちu( x )=xp(指数pは0.3から2の間)によってより適切に説明できることを示した。
多くの研究者が、効用は対数関数とべき乗関数のどちらで表現するのがより適切かを検討した。様々な手法を用いて、べき乗関数の方が効用データに適合しやすいことが示された。[6] [7] [8] [9] [10]その結果、べき乗関数は、累積プロスペクト理論、順位影響乗法(RAM)重みモデル、注意移転交換(TAX)モデルといった心理学的意思決定理論に組み込まれた。しかしながら、一部の経済学の応用では、依然として対数関数が用いられている。[11]
ワッカー[12]は、べき乗関数は負の指数を持つこともあるが、その場合には符号が変化し、増加し続けると指摘した。この一般化された関数族を定義する一つの方法は以下の通りである。
これは指数r ≠0に対して増加する。さらに、 r →0のときのこの関数の極限は、まさに対数関数である: 。したがって、すべての実数pに対する関数族u r ( x )は、べき対数効用と呼ばれることもある。[13]
有用性を評価する手順
効用関数は通常、被験者の宝くじに対する選好を調べる実験で評価されます。一般的に2種類の手順が用いられています。[1]
- 同等性試験では、被験者はある宝くじの金額を、自分にとって別の宝くじと同等になるように調整するよう求められます。例えば、被験者は 2 つの宝くじを検討するよう求められます。(a) 確実に x ドルが手に入る宝くじ、(b) 60% の確率で 20 ドルが手に入り、40% の確率で 0 ドルが手に入る宝くじです。被験者は「xがどのような値であれば、これらの 2 つの宝くじに無関心になりますか」と質問されます。このような質問ごとに、 という形式の方程式が生成されます。この方程式は、効用関数の形を評価するために使用できます。例えば、被験者が x=10 ドルと回答した場合、 という方程式が得られます。べき乗効用を想定すると、 となり、 となります。
- 選択手続きでは、被験者に2つ以上の宝くじを提示し、どちらの宝くじを好むかを尋ねます。例えば、被験者は「(a) 確実に10ドルを得る。(b) 60%の確率で20ドルを得、40%の確率で0ドルを得る」という2つの選択肢から選ぶように求められます。このような質問はそれぞれ、 という形の不等式を生成します。ここで、p 1,iと x 1,iは好ましい宝くじの確率と合計であり、p 2,iと x 2,iは他の宝くじの確率と合計です。選択質問の利点は、回答が容易なことです。このような質問を繰り返すことで、等価点に到達できます。
これらの手順にはいくつかの問題がある。[3]
まず、人々はイベントを真の(客観的な)確率p 1,iとp 2,iで重み付けすると仮定します。実際、多くの証拠が、人々がイベントを主観的な確率で重み付けしていることを示しています。[14]特に、人々は小さな確率を過大評価し、中程度から大きな確率を過小評価する傾向があります(プロスペクト理論を参照)。主観的確率の非線形性は、効用関数の凹面性と混同される可能性があります。たとえば、宝くじ[100%: $10]と[60%:$20、40%:0]に無関心な人は、確率を60%から50%程度に過小評価すると仮定すると、線形効用関数でモデル化できます。
この交絡を避ける一つの方法は、すべてのクエリで等しい確率を用いることです。これは例えば、クームズとコモリタによって行われました[15] 。この方法は、主観的確率が客観的確率の関数であると仮定する非構成的重み理論[16]にも有効です(つまり、すべての客観的確率は一意の主観的確率に変換されます)。この場合、クエリ内のすべての確率が等しいと、方程式においてそれらの確率は打ち消されます。方程式は効用のみを含むため、それらを用いて再び効用関数の形を推論することができます。
しかし、アレーのパラドックスに触発された構成重み理論[ 17]は、主観的確率が客観的確率と結果の両方に依存する可能性があることを示している。カービー[3]は、べき乗対数効用と負指数効用について、予測が主観的確率のキャンセルに依存しないようにクエリを設計する方法を提示した。
2つ目の問題は、一部の実験では利得と損失の両方が用いられていることです。[15] [18]しかし、その後の研究では、効用関数の凹面性は利得と損失で異なる可能性があることが示されています(プロスペクト理論と損失回避を参照)。利得領域と損失領域を組み合わせると、誤った効用関数が得られる可能性があります。
考えられる解決策としては、これら2つの領域をそれぞれ個別に測定することが挙げられます。[19] ユージン・ギャランターは、最初の問題と2番目の問題の両方に対して、別の解決策を考案しました。[6] [20]彼は確率を使わずに実験を行いました。代わりに、彼は「10ドルの2倍の幸福感を得るにはいくらのお金が必要ですか?」といった質問をしました。答えが例えば18ドルであれば、確率やリスク態度への依存性を除いた効用関数に関する情報を与える、次のような式が得られます。彼の実験は、対数関数よりもべき乗関数の方がデータに適合することを一貫して示しました。
3つ目の問題は、ほとんどの実験が、異なる効用モデルの相対的なデータ適合度を比較していることです。例えば、べき乗関数が対数関数よりもデータに適合することを示すことはできますが、べき乗関数がデータに適合するという仮説を棄却することはできません。Kirby [3]は、各モデルの点予測を個別に得ることを可能にする、斬新な実験設計を提示しました。彼の実験は、べき乗対数関数と負の指数関数の両方がデータに適合しないことを示しました。彼は、より適合性の高い関数を見つけることを未解決の問題として残しています。
多属性効用関数の評価
マルチ属性ユーティリティ (MAU) 関数は、 2 つ以上の属性 (お金と自由時間など) を持つバンドルを、そのバンドルからの主観的な満足度を表す数値にマッピングします。
MAUの評価は、確実性がある場合でも重要です。例えば、ほとんどの人は12,000ドルを確実に受け取ることよりも10,000ドルを確実に受け取ることを好みますが、たとえ両方のバンドルが確実であっても、人によってバンドル(10,000ドルの給与、1日8時間の労働)と(12,000ドルの給与、1日9時間の労働)のどちらを選ぶかは異なる場合があります。確実性がある場合のMAUの評価手順は、Ordinal Utility#assessmentで示されています。
不確実な状況での MAU の評価はより複雑です。詳細については 、 multi-attribute utility#assessment を参照してください。
健康で
MAU関数の評価は、特に医療経済学において重要です。多くの場合、複数の治療法の中から選択する必要がありますが、それぞれの治療法は平均余命、生活の質、安全性、費用に関して異なる特性を持っています。広範な調査に基づき、健康関連疾患に関するMAU関数が開発されました。「質調整生存年」と「EQ-5D#評価」を参照してください。健康関連効用を評価する最も一般的な方法は、時間トレードオフです。国レベルでの意思決定を可能にするために、健康に関するMAU関数は、国内の全患者の「平均」効用関数として、国レベルで構築されています。
効用関数は通常、効用1が「完全な健康」、効用0が「死」を意味するように正規化されます。負の効用関数は、「死よりも悪い」状況と見なされる場合に可能です。例として、EQ-5D-Y(若年者向けEuroQol 5次元尺度)の値セットを構築するためのプロトコルを以下に示します。[21]構築は、オンライン離散選択実験(DCE)調査と、対面式の複合時間トレードオフインタビュー(cTTO)の2段階で行われます。
- DCEステップでは、5つの側面の相対的な重要度を測定しますが、正規化された効用値ではなく、潜在尺度に基づいて結果を生成します。推奨される実験設計は10個のブロックで構成され、各ブロックには15組の健康状態(合計150組)が含まれます。被験者には1つのブロック(15組)が与えられます。各組について、被験者はどちらの状態を好むかを答える必要があります(例:「12333と31122のどちらが好きですか?」)。
- cTTOステップは、アンカー状態への正規化値を計算するために使用されます。アンカー状態は状態33333、つまり5つの次元すべてにおいて最悪のレベル(3)の状態です。被験者は10個のTTOクエリに回答する必要があります。各TTOクエリは、健康状態と持続時間のペアを示し、被験者はこれらのうちどちらを好むかを答える必要があります。クエリには2種類あります。[21] : 660、図2
- 一つは、死よりも状態が良いと仮定するものです。質問は「あなたはどちらの人生を選びますか? 完全な健康で2年間生きるか、それとも状態33333で10年間生きるか?」といった感じになります。
- もう1つのタイプは、状態が死よりも悪いと想定しています。質問は「あなたはどちらの人生を選びますか? 完全な健康状態で2年間過ごすか、それとも完全な健康状態で5年間過ごした後、さらに状態33333で10年間過ごすか?」といった感じになります。
どちらのステップでも、被験者は成人であり、10歳の子供の視点から質問に答えるよう求められます。子供ではなく成人に質問する理由は、(1) 成人は納税者であり、医療予算の使い道を決めるのは成人であるべきであること、(2) 死に関する質問があり、子供には不適切である可能性があること、(3) 子供は質問を誤解する可能性があることです。
上記の議定書は、スロベニアで以下のように最初に実行されました。[22]
- DCE調査は、LimeSurveyを用いて、商業市場調査会社(Valicon Ljubljana)のオンラインパネルを通じて、スロベニアの成人1,276名を代表サンプルとして実施されました。実験計画はD効率設計であり、10ブロック(各ブロック15組)に分割されたため、合計150組が比較されました。150組は、フィッシャー情報行列を最大化するペアの中からランダムに選択されました。この設計により、50個のパラメータ(主効果用10パラメータ、二元配置交互作用用40パラメータ)を持つ
多項ロジスティック回帰モデルの推定が可能となりました。
- 品質チェックとして、202 件の回答が削除されました (1 つの健康状態が他の健康状態よりも優勢となる 3 つの固定ペアのうち 2 つを誤って選択した回答と、回答が速すぎた回答)。
- cTTO面接は、210名の成人を対象に対面で実施されました。これらのサンプルは代表サンプルではありません(全員がプリモルスカに居住し、そのほとんどが若者でした)。しかし、代表性を高めるためにサンプルには重み付けが行われました。cTTO課題の要素には、車椅子のシナリオを用いて、「死ぬより悪い」健康状態と「死ぬより良い」健康状態を評価することが含まれます。面接対象者は、10種類のcTTO状態を評価し、EQ-5D-Y記述プロファイルとVAS(視覚アナログ尺度)を記入するよう求められました。
- 品質チェックとして、8 件の応答が削除されました (「死ぬよりも悪い」タスクについての説明がない応答、cTTO 評価が一貫していない (33333 が最低の状態ではない、またはタスクに十分な時間が費やされていない))。
- アンカー状態 33333 の値は -0.691 であることがわかりました。その他の値は 33233:-0.48、31133:-0.049、32223:0.139、22232:0.237、11121:0.911、21111:0.962 でした。
- これら2つのフェーズに基づき、線形加法効用モデルが推定されました。混合ロジットモデルを用いた結果、5つの次元における最悪の結果3の係数は(重要度の高い順から低い順)、痛み/不快感:-0.463、不安/抑うつ:-0.380、普段の活動:-0.322、移動:-0.305、セルフケア:-0.221でした。1-0.463-0.380-0.322-0.305-0.221 = -0.691であり、これはまさに状態33333のアンカー値です。
参照
- グループ意思決定支援システムにおけるMAU法[23 ]
参考文献
- ^ ab Farquhar, Peter H. (1984年11月). 「最新技術:効用評価手法」. Management Science . 30 (11): 1283–1300 . doi :10.1287/mnsc.30.11.1283.
- ^ アルチアン、アーメン・A. (1953). 「効用測定の意味」.アメリカ経済評論. 43 (1): 26– 50. JSTOR 1810289.
- ^ abcd Kirby, Kris N. (2011). 「効用関数の形態に関する実証的評価」. Journal of Experimental Psychology: Learning, Memory, and Cognition . 37 (2): 461– 476. doi :10.1037/a0021968. PMID 21355669.
- ^ フェヒナー、グスタフ・テオドール (1860)。 Elemente der Psychophysik (ドイツ語)。ブライトコフu.ハーテル。[ページが必要]
- ^ Stevens, SS (1957). 「心理物理学的法則について」.心理学評論. 64 (3): 153– 181. doi :10.1037/h0046162. PMID 13441853. ProQuest 614283678.
- ^ ab ギャランター, ユージン (1962). 「効用と主観的確率の直接測定」.アメリカ心理学会誌. 75 (2): 208– 220. doi :10.2307/1419604. JSTOR 1419604. PMID 13896303.
- ^ ギャランター、ユージン;ホルマン、ガービン L. (1967). 「等感度関数のいくつかの不変量と貨幣の効用関数への示唆」.実験心理学ジャーナル. 73 (3): 333– 339. doi :10.1037/h0024275. PMID 6032534. ProQuest 614257044.
- ^ ハンブリン, ロバート L; クレアモント, ドナルド H; チャドウィック, ブルース A (1975年3月). 「効用とギャンブルの意思決定:実験と方程式」.社会科学研究. 4 (1): 1– 15. doi :10.1016/0049-089X(75)90016-2.
- ^ Kornbrot, Diana E.; Donnelly, Michael; Galanter, Eugene (1981年4月). 「信号検出実験による効用関数パラメータの推定」. Journal of Experimental Psychology: Human Perception and Performance . 7 (2): 441– 458. doi :10.1037/0096-1523.7.2.441. ProQuest 614275914.
- ^ パーカー, スコット; スタイン, デイビッド; ダーテ, エド; シュナイダー, ブルース; ポッパー, リチャード; ニーデル, スティーブン (1981). 「コンジョイント測定による貨幣効用関数の決定」.アメリカ心理学会誌. 94 (4): 563– 573. doi :10.2307/1422419. JSTOR 1422419.
- ^ オドノヒュー, テッド; ラビン, マシュー (2006年11月). 「最適罪税」.公共経済学ジャーナル. 90 ( 10–11 ): 1825–1849 . doi :10.1016/j.jpubeco.2006.03.001.
- ^ Wakker, Peter P. (2008年12月). 「電力(CRRA)ユーティリティファミリーの特性の説明」. Health Economics . 17 (12): 1329– 1344. doi :10.1002/hec.1331. PMID 18213676.
- ^ Kale, Jivendra K. (2009). 「デリバティブを含むポートフォリオの最適化におけるべき乗対数効用関数を用いた成長最大化と下落リスクの抑制」International Journal of Computer Applications in Technology . 34 (4): 309. doi :10.1504/IJCAT.2009.024085.
- ^ プレストン、マルコム・G.;バラッタ、フィリップ(1948)「不確実な結果のオークション価値に関する実験的研究」アメリカ心理学会誌61 ( 2): 183-193 . doi :10.2307/1416964. ISSN 0002-9556.
- ^ ab Coombs, C.H.; Komorita, SS (1958). 「意思決定による金銭の効用測定」 .アメリカ心理学会誌. 71 (2): 383– 389. doi :10.2307/1420083. ISSN 0002-9556.
- ^ バーンバウム, マイケル H (1992-08-01). 「効用測定における問題点」 .組織行動と人間の意思決定プロセス. 効用測定. 52 (3): 319– 330. doi :10.1016/0749-5978(92)90024-2. ISSN 0749-5978.
- ^ バーンバウム, マイケル H. (2004-04-01). 「アレの共通帰結パラドックスの原因:実験的分析」 .数学心理学ジャーナル. 48 (2): 87– 106. doi :10.1016/j.jmp.2004.01.001. ISSN 0022-2496.
- ^ モステラー、フレデリック、ノギー、フィリップ (1951年10月1日). 「効用の実験的測定」 .政治経済ジャーナル. 59 (5): 371– 404. doi :10.1086/257106. ISSN 0022-3808.
- ^ ハーシー, ジョン・C.; クンロイター, ハワード・C.; シューメーカー, ポール・JH (1982年8月). 「効用関数の評価手順におけるバイアスの源泉」 .マネジメント・サイエンス. 28 (8): 936– 954. doi :10.1287/mnsc.28.8.936. ISSN 0025-1909.
- ^ ギャランター、ユージン (1990). 「非金銭的イベントの効用関数」 .アメリカ心理学会誌. 103 (4): 449– 470. doi :10.2307/1423318. ISSN 0002-9556.
- ^ ab Ramos-Goñi, Juan M.; Oppe, Mark; Stolk, Elly; Shah, Koonal; Kreimeier, Simone; Rivero-Arias, Oliver; Devlin, Nancy (2020-07-01). 「EQ-5D-Y-3Lの国際評価プロトコル」. PharmacoEconomics . 38 (7): 653– 663. doi : 10.1007/s40273-020-00909-3 . hdl : 11343/252049 . ISSN 1179-2027.
- ^ プレヴォルニク・ルペル、ヴァレンティナ;オゴレフ、マルコ。 IMPACT HTA HRQoL グループ (2021 年 4 月)。 「EQ-5D-Y スロベニア向けバリューセット」。薬学経済学。39 (4): 463–471 .土井:10.1007/s40273-020-00994-4。PMC 8009800。PMID 33565048。
- ^ Bose, Utpal; Davey, Anne M.; Olson, David L. (1997-12-01). 「集団意思決定における多属性効用法:これまでの応用例とGDSSへの導入可能性」 . Omega . 25 (6): 691– 706. doi :10.1016/S0305-0483(97)00040-6. ISSN 0305-0483.