コーディネーションゲーム

ゲーム理論における同時ゲーム

調整ゲームは、ゲーム理論における同時ゲームの一種です。これは、プレイヤーが他のプレイヤーと同じ行動を選択することで、より高い利得を得られる状況を表します。このゲームは純粋な対立ゲームではなく、プレイヤーが一致する戦略を選択する複数の純粋戦略 ナッシュ均衡が生じます。図1は2プレイヤーの例を示しています。

プレイヤー2
プレイヤー1 2,4 1,3
1,3 2,4
 図1: 調整ゲームの利得(プレイヤー1、プレイヤー2)

(上、左) と (下、右) はどちらもナッシュ均衡です。プレイヤーが (上、左) がプレイされると予想している場合、プレイヤー 1 は下へ逸脱すると報酬が 2 から 1 に減少すると考え、プレイヤー 2 は右を選択した場合は報酬が 4 から 3 に減少すると考えます。プレイヤーが (下、右) を予想している場合、プレイヤー 1 は上へ逸脱すると報酬が 2 から 1 に減少すると考え、プレイヤー 2 は左を選択した場合は報酬が 4 から 3 に減少すると考えます。プレイヤーの最適な動きは、他のプレイヤーが何をするかを予想するかによって異なり、均衡から外れた動きの組み合わせをするよりも、両者が協調して行動する方が両者にとって有利になります。この設定は、3 つ以上の戦略や 2 人のプレイヤーにも拡張できます。

調整ゲームの典型的なケースは、運転する道路の側を選ぶことです。これは、広く順守されていれば人命を救うことができる社会的規範です。単純化した例では、2 人のドライバーが狭い未舗装道路で出会ったとします。どちらも正面衝突を避けるために急ハンドルを切らなければなりません。両方が同じ急ハンドル操作を実行すれば、なんとか追い越すことができますが、異なる操作を選択すると衝突します。図 2 の利得マトリックスでは、追い越し成功は利得 8 で、衝突は利得 0 で表されます。この場合、2 つの純粋なナッシュ均衡が存在します。つまり、どちらも左に急ハンドルを切るか、どちらも右に急ハンドルを切るかのどちらかです。この例では、両方のプレーヤーが同じ側を選択する限り、どちらの側を選択してもかまいません。どちらの解もパレート効率的ですこのゲームは純粋調整ゲームと呼ばれます。図 3 の 保証ゲームが示すように、これはすべての調整ゲームに当てはまるわけではありません。

保証ゲームは、どちらのプレイヤーも単独では十分な金額を提供できない状況を表します。そのため、プレイヤー2が裏切った場合、プレイヤー1はゲームから裏切る必要があります。ただし、プレイヤー2が貢献することを選択した場合は、プレイヤー1も貢献する必要があります。[1]保証ゲームは一般に「スタッグハント」(図5)と呼ばれ、次のシナリオを表します。2人のハンターは、一緒にスタッグを狩るか(最も経済的に効率的な結果をもたらす)、個別にウサギを狩るかを選択できます。スタッグハンティングは困難であり、協力が必要です。2人のハンターが協力しない場合、成功する可能性は最小限です。したがって、両方のハンターが調整を選択するシナリオが、社会にとって最も有益な出力を提供します。スタッグハントに関連する一般的な問題は、この出力を達成するために必要な信頼の量です。[2]図5は、両方のプレイヤー(ハンター)が協力(スタッグハンティング)すれば利益を得ることができる状況を示しています。ご覧の通り、協力は失敗する可能性があります。なぜなら、それぞれのハンターには、成功するために協力を必要としないより安全な選択肢(ウサギ狩り)があるためです。安全性と社会的協力の間の潜在的な衝突を示すこの例は、もともとジャン=ジャック・ルソーに由来しています。[3]

図2純粋な協調
図3保証ゲーム
図4男女の戦い
図5鹿狩り

図4に示すように、一般的に男女対決(または利害対立調整)と呼ばれる別のタイプの調整ゲームでは、状況は異なります。このゲームでは、両方のプレイヤーは一人で行動するよりも同じ活動に参加することを好みますが、どちらの活動に参加するかについては好みが異なります。あるカップルが週末に何をするかで口論しているとします。二人とも週末を一緒に過ごすことで効用が高まることは分かっていますが、男性はフットボールの試合を観戦することを、女性は買い物に行くことを好みます。[4]

カップルは一緒に時間を過ごしたいので、別々に活動を行うことで得られる効用はありません。買い物に行ったり、サッカーの試合に行ったりする場合、片方はもう片方と一緒にいることでいくらかの効用を得ますが、活動自体からは効用を得ません。前述の他の種類のコーディネーションゲームとは異なり、相手の戦略を知っていても、自分の行動方針を決定するのに役立ちません。そのため、均衡状態に到達しない可能性があります。[5]

自主基準

社会科学において、自主規格(デファクトスタンダードとも呼ばれる)は、調整問題に対する典型的な解決策である。[6]自主規格の選択は、すべての関係者が相互に利益を享受できる状況において安定的である傾向があるが、それは相互に一貫性のある決定を下すことによってのみ実現される。
対照的に、義務規格(「デジュールスタンダード」として法律で強制される)は、囚人問題に対する解決策である[6]

混合戦略ナッシュ均衡

調整ゲームにも混合戦略 ナッシュ均衡が存在します。上記の一般的な調整ゲームでは、混合ナッシュ均衡は、プレイヤー1が上をプレイする確率がp = (db)/(a+dbc)、下をプレイする確率が1-p、プレイヤー2が左をプレイする確率がq = (DC)/(A+DBC)、右をプレイする確率が1-qで与えられます。d > bかつdb < a+dbcであるため、pは常に0と1の間であり、存在が保証されます(qについても同様)。

図6.調整ゲーム


図6の一般的な調整ゲームでは、混合ナッシュ均衡は確率によって与えられます。

p = (db)/(a+dbc)、

プレイヤー1がオプションAをプレイし、1-pでオプションBをプレイし、

q = (DC)/(A+DBC)、

プレイヤー2がAをプレイするには1-q、Bをプレイするには1-qです。図1を見て、同じ確率方程式を適用すると、次の結果が得られます。

p = (4-3) / (4+4-3-3) = ½ であり、

q = (2-1) / (2+2-1-1) = ½

2×2協調ゲームの反応対応を図7に示す。

図7 - 2x2調整ゲームにおける反応対応。ナッシュ均衡は、2人のプレイヤーの対応が交差する点にある。

純粋ナッシュ均衡は戦略空間の左下隅と右上隅の点であり、混合ナッシュ均衡は中央の破線の交点にあります。

純粋ナッシュ均衡とは異なり、混合均衡は進化的に安定な戦略(ESS)ではありません。混合ナッシュ均衡は、2つの純粋ナッシュ均衡によってパレート支配されます(プレイヤーが非ゼロの確率で協調に失敗するため)。この難問から、ロバート・オーマンは相関均衡の改良を提案しました

調整と平衡選択

上記の運転の例のようなゲームは、調整問題の解決の必要性を示しています。私たちはしばしば、パートナーとコミュニケーションが取れない状況で調整問題を解決しなければならない状況に直面します。多くの著者は、特定の均衡が何らかの理由で焦点的であると示唆しています。例えば、ある均衡はより高い報酬を与え、自然に顕著になり、より公平になり、より安全になる可能性があります。時にはこれらの改良が矛盾し、特定の調整ゲームが特に複雑で興味深いものになります(例えば、鹿狩りでは、{鹿、鹿}の方が報酬は高くなりますが、{ウサギ、ウサギ}の方が安全です)。

実験結果

コーディネーションゲームは実験室実験で研究されてきました。ボルトロッティ、デヴェタグ、アンドレアス・オルトマンによる実験の一つは、個人と集団のインセンティブの違いを測定するために、複数のグループにコインを数え、分類させるという弱結合実験でした。この実験では、参加者は個人のパフォーマンスに基づいた報酬に加え、最もパフォーマンスの低いチームメンバーのエラー数に応じて加重されたボーナスを受け取りました。参加者は時間を購入するオプションも与えられましたが、その費用は報酬から差し引かれました。当初、グループはコーディネーションに失敗しましたが、ゲームを繰り返すと、実験に参加したグループの約80%がコーディネーションに成功したことが研究者によって観察されました。[7]

学者が協調の失敗について語る場合、ほとんどの場合、被験者は利得優位性ではなくリスク優位性を達成するとされています。プレイヤーが1つの均衡で協調した方が利得がより良い場合でも、多くの場合、人々は何らかの利得が保証されているリスクの低い選択肢を選び、最終的には利得が最適ではない均衡に陥ります。リスクを取るか安全な選択肢を取るかの差が小さい場合、プレイヤーはよりリスクの高い選択肢で協調に失敗する可能性が高くなります。実験結果は、協調の失敗が順序統計ゲームやスタッグハントゲームにおいて一般的な現象であることを示唆しています。[8]

外部性を持つ他のゲーム

調整ゲームは、経済の外部性概念、特に正のネットワーク外部性(他のエージェントと同じネットワークにいることによる利益)と密接に関連しています。逆に、ゲーム理論家は、同じ行動を選択すると利益ではなくコストが発生する、負の外部性下の行動をモデル化しています。この種のゲームの総称は反調整ゲームです。2 人のプレイヤーによる反調整ゲームの最もよく知られた例は、チキンゲーム(タカ-ハト ゲームとも呼ばれる)です。図 1 の利得行列を使用すると、行プレイヤー 1 に対して B > A かつ C > D の場合(列プレイヤー 2 に対しては、小文字の類似体で b > d かつ c > a の場合)、ゲームは反調整ゲームです。{下、左} と {上、右} は、2 つの純粋なナッシュ均衡です。チキンゲームではA > Cも必要となるため、{上、左}から{上、右}への変更はプレイヤー2の利得を向上させる一方で、プレイヤー1の利得を低下させ、対立を引き起こします。これは、戦略における一方的な変更はすべて双方の利益か双方の損失につながるという、標準的な調整ゲームの設定に反するものです。

反調整ゲームの概念は、マルチプレイヤー状況に拡張されています。混雑ゲームは、各プレイヤーの利得が、同じ戦略を選択する他のプレイヤーの数に対して非増加であるゲーム(つまり、負のネットワーク外部性を持つゲーム)として定義されます。たとえば、ドライバーはサンフランシスコからサンノゼまでアメリカ国道101号線または州間高速道路280号線を使用できます。101号線の方が短いですが、280号線の方が景色がよいと考えられているため、ドライバーは交通量とは関係なく、2つの間で異なる好みを持つ可能性があります。しかし、どちらかのルートで車が増えるごとにそのルートの運転時間がわずかに長くなるため、交通量が増えると負のネットワーク外部性が生じ、景色を重視するドライバーでも280号線が混雑しすぎると101号線を選択する可能性があります。混雑ゲームは、ネットワークにおける混雑ゲームです。少数派ゲームは、すべてのプレーヤーの唯一の目的が2つのグループのうち小さい方のグループに参加することであるゲームです。少数派ゲームの有名な例は、W・ブライアン・アーサーが提唱したエル・ファロル・バー問題です。

協調と反協調の混合形態が不協調ゲームである。このゲームでは、一方のプレイヤーは協調しようとするインセンティブを持ち、もう一方のプレイヤーは協調を避けようとする。不協調ゲームには純粋なナッシュ均衡は存在しない。図1では、A > B、C < D、かつa < b、c > dとなるように利得を選択すると、不協調ゲームが生じる。4つの可能な状態のそれぞれにおいて、プレイヤー1またはプレイヤー2のいずれかが戦略を切り替えることで有利になるため、ナッシュ均衡は混合状態となる。不協調ゲームの典型的な例は、ペニーマッチングゲームである。

参照

参考文献

  1. ^ 「Assurance Game - P2P Foundation」. wiki.p2pfoundation.net . 2021年4月23日閲覧
  2. ^ 「保証ゲーム - ゲーム理論.net」www.gametheory.net . 2021年4月23日閲覧
  3. ^ 「コーディネーションゲームの定義 | Higher Rock Education」www.higherrockeducation.org . 2021年4月23日閲覧
  4. ^ 「ゲーム理論II:男女の戦い|ポリコノミクス」2021年4月26日閲覧
  5. ^ 「ゲーム理論II:男女の戦い|ポリコノミクス」2021年4月23日閲覧
  6. ^ エドナ・ウルマン=マルガリット(1977年)『規範の出現』オックスフォード大学出版局、ISBN 978-0-19-824411-0
  7. ^ ボルトロッティ, ステファニア; デヴェタグ, ジョヴァンナ; オルトマン, アンドレアス (2016年1月1日). 「集団インセンティブか個人インセンティブか? 実労働における弱リンク実験」 .経済心理学ジャーナル. 56 (C): 60– 73. doi :10.1016/j.joep.2016.05.004. ISSN  0167-4870.
  8. ^ デヴェタグ、ジョヴァンナ、オルトマン、アンドレアス (2006年8月15日). 「いつ、なぜ?実験室における協調の失敗に関する批判的調査」ロチェスター、ニューヨーク州: 社会科学研究ネットワーク. SSRN  924186. {{cite journal}}:ジャーナルを引用するには|journal=ヘルプ)が必要です

その他の推奨文献:

「https://en.wikipedia.org/w/index.php?title=コーディネーションゲーム&oldid=1301932997」より取得