価値のないゲーム

シオンとウルフの法則により、価値のないゲームにおけるゲームスクエア(つまりプレイヤーIの利得)。2本の対角線上の利得は0である。

ゲームの数学的理論、特にゼロ和連続ゲームの研究では、すべてのゲームがミニマックス値を持つわけではありません。ミニマックス値とは、両方のプレイヤーが完全戦略(特定の確率密度関数(PDF )から選択する戦略)を採用した場合の、一方のプレイヤーの期待値です。

この記事は、価値のないゼロサムゲームの例を示しています。これはシオンウルフによるものです。[ 1 ]

有限個の純粋戦略を持つゼロサムゲームはミニマックス値を持つことが知られています(これは元々ジョン・フォン・ノイマンによって証明されました)。しかし、ゲームに無限個の戦略が存在する場合、必ずしもそうとは限りません。以下に、ミニマックス値を持たないゲームの簡単な例を示します。

このようなゼロサムゲームの存在は、ミニマックス値がなければ ゲーム理論の結果の多くが適用できなくなるため興味深いものです。

ゲーム

プレイヤー I と II はそれぞれ 0 から 1 までの数字とを選択します。プレイヤー I への支払いは、 つまり、選択が行われた後、プレイヤー II がプレイヤー I に支払います (したがって、ゲームはゼロサムです)。 ×{\displaystyle x}y{\displaystyle y}K×y{1もし ×<y<×+1/20もし ×y または y×+1/21さもないと。{\displaystyle K(x,y)={\begin{cases}-1&{\text{if }}x<y<x+1/2,\\0&{\text{if }}x=y{\text{ or }}y=x+1/2,\\1&{\text{otherwise.}}\end{cases}}}K×y{\displaystyle K(x,y)}

ペアを単位正方形上の点と解釈すると、図はプレイヤーIの利得を示します。プレイヤーIは、確率密度関数(pdf)に従って数値を選択する混合戦略を採用し、同様にプレイヤーIIはpdfから選択します。プレイヤーIは利得を最大化することを目指し、プレイヤーIIは利得を最小化することを目指します。そして、各プレイヤーは相手の目的を認識しています。 ×y{\displaystyle (x,y)}f{\displaystyle f}グラム{\displaystyle g}K×y{\displaystyle K(x,y)}

ゲームの価値

Sion と Wolfe は 、しかし、 これらはそれぞれプレイヤー I と II のゲームの価値の最大期待値と最小期待値であることを示しています。 すするf無限大グラムKdfdグラム13{\displaystyle \sup _{f}\inf _{g}\iint K\,df\,dg={\frac {1}{3}}}無限大グラムすするfKdfdグラム37{\displaystyle \inf _{g}\sup _{f}\iint K\,df\,dg={\frac {3}{7}}.}

とは、それぞれ単位区間上の確率密度関数(実際にはボレル確率測度)の最大値と最小値を取る。これらはプレイヤーIとプレイヤーIIの(混合)戦略を表す。したがって、プレイヤーIはプレイヤーIIの戦略を知っていれば少なくとも3/7の利得を確保でき、プレイヤーIIはプレイヤーIの戦略を知っていれば利得を1/3に抑えることができる。 すする{\displaystyle \sup}無限大{\displaystyle \inf }

十分に小さい、具体的には の場合には、イプシロン均衡は存在しない。ダスグプタとマスキン[ 2 ]は、プレイヤーIが確率重みをセットのみに置き、プレイヤーIIが のみに重みを置くと、ゲームの価値が達成されると主張している。 ε{\displaystyle \varepsilon }ε<1237130.0476{\displaystyle \varepsilon <{\frac {1}{2}}\left({\frac {3}{7}}-{\frac {1}{3}}\right)\simeq 0.0476}{01/21}{\displaystyle \left\{0,1/2,1\right\}}{1/41/21}{\displaystyle \left\{1/4,1/2,1\right\}}

グリックスバーグの定理は、上限または下限の半連続的な利得関数を持つ任意のゼロ和ゲームが値を持つことを示しています (この文脈では、上限 (下限) 半連続関数Kは、任意の実数cに対して集合(resp ) が開いている関数です)。 {PKP<c}{\displaystyle \{P\mid K(P)<c\}}{PKP>c}{\displaystyle \{P\mid K(P)>c\}} 

SionとWolfeの例の利得関数は半連続ではありません。しかし、K ( xx )とK ( xx  +1/2)(2つの不連続点における利得)の値を+1または-1に変更することで、それぞれ上限半連続または下限半連続にすることができます。このように変更すれば、ゲームには価値があります。

一般化

ホイヤー[ 3 ]によるその後の研究は、単位正方形が3つの領域に分割され、各領域での利得関数が一定であるゲームのクラスについて議論している。

参考文献

  1. ^シオン、モーリス; ウルフ、フィリップ (1957)、「価値のないゲームについて」、ドレッシャー、M.、タッカー、AW、ウルフ、P. (編)、『ゲーム理論への貢献III』、数学研究年報39、プリンストン大学出版局、pp.  299– 306、ISBN 9780691079363{{citation}}:ISBN / 日付の非互換性(ヘルプ
  2. ^ P. ダスグプタE. マスキン(1986). 「不連続経済ゲームにおける均衡の存在 I: 理論」. Review of Economic Studies . 53 (1): 1– 26. doi : 10.2307/2297588 . JSTOR 2297588 . 
  3. ^ GA Heuer (2001). 「長方形上の3部分割ゲーム」理論計算機科学259 : 639–661 . doi : 10.1016 /S0304-3975(00)00404-7 .