メルテンス安定平衡

Solution concept for non-cooperative games

ゲーム理論においてメルテンス安定性は非協力ゲームの結果を予測するために用いられる解概念である。安定性の暫定的な定義は、プレイヤー数と戦略数が有限であるゲームについて、イーロン・コールバーグとジャン=フランソワ・メルテンス[1]によって提案された。その後、メルテンス[2] [3]はより強力な定義を提案し、それはスリハリ・ゴビンダンとメルテンス[4]によってさらに精緻化された。この解概念は現在、メルテンス安定性、あるいは単に安定性と呼ばれている。

ゲーム理論で用いられるナッシュ均衡の他の改良[5]と同様に 、安定性はナッシュ均衡の集合のうち望ましい特性を持つ部分集合を選択する。安定性は他の改良よりも強い基準を適用し、より望ましい特性が満たされることを保証する。

改良の望ましい特性

洗練化は、許容可能性、後方帰納法、前方帰納法の議論に動機付けられることが多い。2人プレイのゲームでは、プレイヤーの許容される決定ルールとは、他のプレイヤーによって弱支配される戦略を一切使用しないルールである(戦略的優位性を参照)。後方帰納法は、プレイヤーの最適行動は、いずれにせよ、自分と他のプレイヤーのその後の行動が最適であると予期していると仮定する。部分ゲーム完全均衡と呼ばれる洗練化は後方帰納法の弱いバージョンを実装し、より強いバージョンは、順次均衡完全均衡準完全均衡、および真均衡である。前方帰納法は、プレイヤーの最適行動は、いずれにせよ、自分の観察と一致する場合はいつでも、他のプレイヤーの過去の行動が最適であると推定していると仮定する。前向き誘導[6]は、プレイヤーの情報セットに対する信念が、その情報に到達することを可能にする他のプレイヤーの最適戦略にのみ確率を割り当てる順次均衡によって満たされます。

コールバーグとメルテンスはさらに、解決概念は、拡張形式ゲームとしての戦略状況の多くの同等な表現のどれが使用されるかに依存しないという不変性原理を満たす必要があることを強調した。つまり、解決概念は、すべてのプレーヤーの利得が他の純粋戦略の混合によって再現できるため冗長な純粋戦略を排除した後に得られる縮小正規形ゲームにのみ依存するべきである。メルテンス[7] [8]はまた、解決概念はプレーヤーの選好の順序特性のみに依存するべきであり、行動が元のプレーヤーの実行可能な戦略と利得に影響を与えない外部プレーヤーがゲームに含まれているかどうかに依存すべきではないというスモールワールド原理の重要性も強調した。

コールバーグとメルテンスは、これらの特性の全てが、単一のナッシュ均衡を選択する解概念からは得られないことを例を用いて示した。したがって、彼らは、解概念はナッシュ均衡の集合の閉連結部分集合を選択すべきであると提案した。[9]

安定集合の性質

  • 許容性と完全性: 安定した集合内の各均衡は完全であり、したがって許容可能です。
  • 後方誘導と前方誘導:安定集合には、ゲームの正規形の適切な均衡が含まれ、この均衡は、同じ正規形を持つ完全想起を持つすべての展開形ゲームにおいて、準完全均衡、ひいては連続均衡を誘導する。安定集合の部分集合は、弱支配戦略と、集合内のあらゆる均衡において劣った回答となる戦略を繰り返し除去しても残存する。
  • 不変性とスモールワールド:ゲームの安定集合は、元のプレイヤーの実行可能な戦略と利得を維持しながら、そのゲームが組み込まれているより大きなゲームの安定集合の投影である。[10]
  • 分解とプレイヤー分割。2つの独立ゲームの積の安定集合は、それぞれの安定集合の積である。安定集合は、プレイヤーをエージェントに分割しても影響を受けず、ゲームツリーのどのパスにも2つのエージェントの行動は含まれない。

完全な想起と一般的な報酬を持つ2人用ゲームの場合、安定性はこれらの特性のうちの3つに相当します。安定したセットは非劣後戦略のみを使用し、準完全な均衡を含み、より大きなゲームへの埋め込みの影響を受けません。[11]

安定集合の定義

安定集合は、プレイヤーの戦略を完全混合戦略へと摂動させることで得られる摂動ゲーム空間上のナッシュ均衡のグラフにおける閉連結近傍からの射影写像の本質性によって数学的に定義される。この定義は、近傍のゲームがすべて近傍均衡を持つことを要求する以上のものを必要とする。本質性はさらに、射影写像が境界に変形しないことを要求する。これにより、ナッシュ均衡を定義する不動点問題の摂動が近傍解を持つことが保証される。これは、上記に挙げたすべての望ましい特性を得るために明らかに必要である。

メルテンスは、ホモロジーまたはコホモロジーに使用される係数モジュールに応じて、いくつかの正式な定義を提供しました

正式な定義には何らかの表記法が必要です。 与えられたゲームについて、 をプレイヤーの混合戦略の単体の積とします。各 についてをその位相境界とし、をその位相境界とします。 について、を任意の純粋戦略の最小確率 とします。任意の について、摂動ゲームを、各プレイヤーの戦略セットが におけると同じであるが、戦略プロファイル からの利得がプロファイル からのにおける利得であるゲームと定義します。が の均衡である場合に、 が の摂動均衡であるとしますを 上の摂動均衡対応のグラフとします。つまり、 グラフはが の摂動均衡であるようなペアの集合です。 については の対応する均衡です。からの自然な射影マップを で表します。 について、 について とします。最後に、は整数係数の チェフコホモロジーを指します。 G {\displaystyle G} Σ {\displaystyle \Sigma } 0 < δ 1 {\displaystyle 0<\delta \leq 1} P δ = { ϵ τ 0 ϵ δ , τ Σ } {\displaystyle P_{\delta }=\{\,\epsilon \tau \mid 0\leq \epsilon \leq \delta ,\tau \in \Sigma \,\}} P δ {\displaystyle \partial P_{\delta }} η P 1 {\displaystyle \eta \in P_{1}} η ¯ {\displaystyle {\bar {\eta }}} η P 1 {\displaystyle \eta \in P_{1}} G ( η ) {\displaystyle G(\eta )} n {\displaystyle n} G {\displaystyle G} τ {\displaystyle \tau } G {\displaystyle G} σ = ( 1 η ¯ ) τ + η {\displaystyle \sigma =(1-{\bar {\eta }})\tau +\eta } σ {\displaystyle \sigma } G ( η ) {\displaystyle G(\eta )} τ {\displaystyle \tau } G ( η ) {\displaystyle G(\eta )} E {\displaystyle {\mathcal {E}}} P 1 {\displaystyle P_{1}} E {\displaystyle {\mathcal {E}}} ( η , σ ) P 1 × Σ {\displaystyle (\eta ,\sigma )\in P_{1}\times \Sigma } σ {\displaystyle \sigma } G ( η ) {\displaystyle G(\eta )} ( η , σ ) E {\displaystyle (\eta ,\sigma )\in {\mathcal {E}}} τ ( η , σ ) ( σ η ) / ( 1 η ¯ ) {\displaystyle \tau (\eta ,\sigma )\equiv (\sigma -\eta )/(1-{\bar {\eta }})} G ( η ) {\displaystyle G(\eta )} p {\displaystyle p} E {\displaystyle {\mathcal {E}}} P 1 {\displaystyle P_{1}} E E {\displaystyle E\subseteq {\mathcal {E}}} E 0 = { ( 0 , σ ) E } {\displaystyle E_{0}=\{\,(0,\sigma )\in E\,\}} 0 < δ 1 {\displaystyle 0<\delta \leq 1} ( E δ , E δ ) = p 1 ( P δ , P δ ) E {\displaystyle (E_{\delta },\partial E_{\delta })=p^{-1}(P_{\delta },\partial P_{\delta })\cap E} H ˇ {\displaystyle {\check {H}}}

以下は、Mertens の定義の中で最も包括的な、*-安定性と呼ばれるバージョンです。

*-安定集合の定義:に対して次の 2 つの特性を持つ 場合、 は *-安定集合となります S Σ {\displaystyle S\subseteq \Sigma } E {\displaystyle E} E {\displaystyle {\mathcal {E}}} E 0 = { 0 } × S {\displaystyle E_{0}=\{\,0\,\}\times S}

  • 連結性:の のすべての近傍に対して、その閉包が内の の近傍である連結成分がセットに存在します V {\displaystyle V} E 0 {\displaystyle E_{0}} E {\displaystyle E} V E 1 {\displaystyle V\setminus \partial E_{1}} E 0 {\displaystyle E_{0}} E {\displaystyle E}
  • コホモロジー本質性:は、ある に対してゼロ以外になります p : H ˇ ( P δ , P δ ) H ˇ ( E δ , E δ ) {\displaystyle p^{*}:{\check {H}}^{*}(P_{\delta },\partial P_{\delta })\to {\check {H}}^{*}(E_{\delta },\partial E_{\delta })} δ > 0 {\displaystyle \delta >0}

コホモロジーやホモロジーにおける本質性がホモトピーに緩和されると、より弱い定義が得られる。これは主に分解特性のより弱い形式において異なる。[12]

参考文献

  1. ^ イーロン、コールバーグ;メルテンス、ジャン=フランソワ(1986)。 「均衡の戦略的安定性について」(PDF)エコノメトリカ54 ( 5 ): 1003–1037。CiteSeerX 10.1.1.295.4592 土井:10.2307/1912320。JSTOR  1912320。 
  2. ^ メルテンス、ジャン=フランソワ(1989). 「安定均衡—再定式化 パートI. 定義と基本的性質」.オペレーションズ・リサーチ数学. 14 (4): 575– 625. doi :10.1287/moor.14.4.575. JSTOR  3689732.
  3. ^ メルテンス、ジャン=フランソワ(1991). 「安定均衡—再定式化 パートII. 定義の考察と更なる結果」. オペレーションズ・リサーチ数学. 16 (4): 694– 753. doi :10.1287/moor.16.4.694. JSTOR  3689907.
  4. ^ Govindan, Srihari; Mertens, Jean-François (2004). 「安定均衡の等価定義」.国際ゲーム理論ジャーナル. 32 (3): 339– 357. doi :10.1007/s001820400165. hdl :10.1007/s001820400165.
  5. ^ Govindan, Srihari & Robert Wilson, 2008. 「ナッシュ均衡の改良」『新パルグレイブ経済学辞典』第2版。「アーカイブコピー」(PDF) 。 2010年6月20日時点のオリジナル(PDF)からのアーカイブ。 2012年2月12日閲覧{{cite web}}: CS1 maint: archived copy as title (link)
  6. ^ Govindan, Srihari; Wilson, Robert (2009). 「前向き誘導について」. Econometrica . 77 (1): 1– 28. doi :10.3982/ECTA6956.
  7. ^ メルテンス、ジャン=フランソワ(2003). 「非協力ゲームにおける順序性」.国際ゲーム理論ジャーナル. 32 (3): 387– 430. doi :10.1007/s001820400166.
  8. ^ メルテンス、ジャン=フランソワ (1992). 「安定均衡のためのスモールワールド公理」.ゲームと経済行動. 4 (4): 553– 564. doi :10.1016/0899-8256(92)90036-R.
  9. ^ 集合が連結であるという要件は、すべての均衡点を選択するという自明な改良を排除する。単一の(連結されていない可能性のある)部分集合のみが選択される場合、自明な改良のみが、Norde, Henk; Potters, Jos; Reijnierse, Hans; Vermeulen, Dries (1996). "Equilibrium Selection and Consistency". Games and Economic Behavior . 12 (2): 219– 225. doi :10.1006/game.1996.0014. hdl : 2066/27895 .によって要求される条件を満たす。
  10. ^ Govindan & Wilson (2012)の付録Dを参照
  11. ^ Govindan, Srihari; Wilson, Robert (2012). 「一般的な2人用ゲームにおける均衡選択の公理的理論」(PDF) . Econometrica . 80 (4): 1639– 1699. doi :10.3982/ECTA9579.
  12. ^ Govindan, Srihari; Wilson, Robert (2008). 「準安定平衡」.オペレーションズ・リサーチ数学. 33 (4): 787– 820. doi :10.1287/moor.1080.0336.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Mertens-stable_equilibrium&oldid=1256584978"