不完全情報ネットワークゲーム

不完全情報ネットワークゲームは、エージェントが近隣エージェント、すなわちネットワーク構造と近隣エージェントとのリンク形成から生じる価値を事前に知らない場合の戦略的なネットワーク形成を表す。このような設定では、エージェントは近隣エージェントとの結びつきの価値に関する事前信念を持ち、その事前信念に基づいて行動し、ゲームの履歴に基づいて信念を更新する。 [1]ネットワーク構造が完全に既知のゲームは広く応用可能であるが、プレイヤーが誰と相互作用するか、近隣エージェントの行動がどのようなものかを完全に知らずに行動するケースも数多く存在する。[2]

例えば、大学専攻を選択する人々は、不完全情報に基づくネットワークゲームとして形式化することができます。つまり、彼らはその専攻を選択する人の数について何かを知っていて、異なる専攻の就職市場について何かを推測するかもしれませんが、誰と交流しなければならないかは知らず、したがってネットワークの構造も知りません。[3]

ゲーム理論的定式化

この設定[3]では、プレイヤーはネットワークに関する非公開かつ不完全な情報を持ち、この非公開情報はプレイヤー自身のタイプ(ここでは自身の次数に関する非公開知識)として解釈される。プレイヤーは自身の次数を条件として、近隣プレイヤーの次数に関する信念を形成する。このゲームの均衡概念はベイズ・ ナッシュ均衡である。プレイヤーの戦略は、プレイヤーの次数からプレイヤーの行動へのマッピングである。

、次数 d のプレイヤーがアクション 1 を選択する確率とします。ほとんどの次数 (d) ではアクションは 0 か 1 のいずれかになりますが、場合によっては混合戦略が発生する可能性があります。 σ d [ 0 1 ] {\displaystyle \textstyle \sigma _{(d)}\in [0,1]}

i の近傍の次数は次数分布 から抽出されます。ここで、 は、P で表される 次数シ​​ーケンスに関する構成モデルからの近傍の次数に関する分布を近似します。 P {\displaystyle \textstyle {\チルダ {P}}} P d P d d d {\displaystyle \textstyle {\チルダ {P}}(d)={\frac {P(d)d}{\langle d\rangle }}}

が与えられた場合、近傍がアクション 1 を実行する確率は次のようになります P {\displaystyle \textstyle {\チルダ {P}}} p σ d σ d P d {\displaystyle \textstyle p_{\sigma }=\sum _{d}\sigma (d){\tilde {P}}(d)}

漸近的には、プレイヤー i の d 人の隣人のうち正確に m 人がアクション 1 を選択するという確信は二項分布 に従います。   d メートル p σ メートル 1 p σ d メートル {\displaystyle \textstyle \ {d_{i} \choose m}p_{\sigma }^{m}(1-p_{\sigma })^{(d_{i}-m)}}

したがって、アクションを実行する次数のプレイヤー i の期待効用は次のように与えられます。 ここで、は特定のネットワーク構造でプレイされるゲームに対応する報酬です。このゲームでは、プレイヤーは、近隣のリンク形成に関する不完全な情報が与えられた場合、自分が持つリンクの数はわかっているものの、どのネットワークが実現されるかはわからない状態で戦略を選択します。   d {\displaystyle \textstyle \ d_{i}}   × {\displaystyle \textstyle \ x_{i}}   あなた d × p σ メートル 0 d あなた d × メートル d メートル p σ メートル 1 p σ d メートル {\displaystyle \textstyle \U_{d_{i}}(x_{i},p_{\sigma })=\sum _{m=0}^{d_{i}}u_{d_{i}}(x_{i},m){d_{i} \choose m}p_{\sigma }^{m}(1-p_{\sigma })^{(d_{i}-m)}}   あなた d {\displaystyle \textstyle \ u_{d_{i}}}

近傍プレイヤーの次数が独立であると仮定すると、上記のゲームの定式化はプレイヤーの正確な集合に関する知識を必要としません。ネットワークゲームは、各dの効用 と近傍プレイヤーの次数の分布を定義することで規定されます   あなた d {\displaystyle \textstyle \ u_{d}} P {\displaystyle \textstyle {\チルダ {P}}}

このネットワーク ゲームのベイズ均衡は、各 d に対して、 であれば、 であればとなる戦略です σ d {\displaystyle \textstyle \sigma (d)} σ d > 0 {\displaystyle \textstyle \sigma (d)>0}   あなた d 1 p σ あなた d 0 p σ {\displaystyle \textstyle \U_{d}(1,p_{\sigma })\geq U_{d}(0,p_{\sigma })} σ d < 1 {\displaystyle \textstyle \sigma (d)<1}   あなた d 1 p σ あなた d 0 p σ {\displaystyle \textstyle \U_{d}(1,p_{\sigma })\leq U_{d}(0,p_{\sigma })}

ネットワーク上で行われる不完全情報ゲームの例

公共財のローカル提供のネットワークゲーム[4]を考えてみましょう。エージェントの行動は戦略的代替です(つまり、特定の行動をとる個人の利益は、パートナーが同じ行動をとる場合よりも大きくない)。したがって、戦略的代替の場合、均衡行動はプレイヤーの次数において非増加です。

何らかのネットワーク関係で接続されたプレーヤーまたは個人の有限集合を定義します { 1 n } {\displaystyle \textstyle N=\left\{1,...,n\right\}}

最も単純なフレームワークは、2 つのエージェントが接続されているか接続されていないかのいずれかである無向ネットワークを考えることです。

接続は隣接行列 によって表され、 はi の利得が j の動作によって影響を受けることを意味します。   グラム { 0 1 } n × n {\displaystyle \textstyle \g\in \left\{0,1\right\}^{n\times n}}   グラム j 1 {\displaystyle \textstyle \ g_{ij}=1}

慣例的に、すべての に対して   グラム 0 {\displaystyle \textstyle \ g_{ii}=0}   {\displaystyle \textstyle \i\in N}

プレイヤーの近傍集合を と定義します   {\displaystyle \textstyle \i}   グラム { j | グラム j 1 } {\displaystyle \textstyle \N_{i}(g)=\left\{j|g_{ij}=1\right\}}

プレイヤーの接続数、つまりその次数は によって与えられます   {\displaystyle \textstyle \i}   グラム | グラム | {\displaystyle \textstyle \ k_{i}(g)=|N_{i}(g)|}

各個人は独立して のアクションを選択する必要があります。1 はアクションを実行することを示し、0 はアクションを実行しないことを示します。   X { 0 1 } {\displaystyle \textstyle \X=\left\{0,1\right\}}

利得は と定義され、これは、エージェント i によって選択されたアクション、および と定義される近隣での総アクションの合計です   y × + × ¯ {\displaystyle \textstyle \y_{i}\equiv x_{i}+{\overline {x}}_{Ni}}   × {\displaystyle \textstyle \ x_{i}} × ¯ j × j {\displaystyle \textstyle {\overline {x}}_{Ni}\equiv \sum _{j\in N_{i}}x_{j}}

エージェント i の総利得は、 の場合は 1 、 以外の場合は 0 と仮定します。公共財の提供、つまり行動 1 の選択にはコスト c がかかります。ここで、 ですが、行動 0 にはコストはかかりません。ゲームの純利得は、総利得からコスト c を差し引いたものとして定義されます。コストが与えられている場合、エージェントは近隣の誰かが行動 1 を取ることを望み、自分自身はその行動を取りたくありません。i の近隣の誰かが貢献すれば、公共財が提供され、エージェント i はフリーライドになります。しかし、i の近隣の誰も貢献しなければ、エージェント i は喜んで貢献し、行動 1 を取るでしょう。   y 1 {\displaystyle \textstyle \y_{i}\geq 1}   0 < c < 1 {\displaystyle \textstyle \ 0<c<1}

不完全情報(プレイヤーは確率分布によって要約される近傍の次数に関する信念を形成する)の下では、プレイヤーの純粋戦略は次数 k から行動 への写像として定義できる。N 個のエージェントのうち任意の 2 個の間に、確率 で独立にリンクが形成されるとする。ランダムに選択された近傍が次数 k である確率は、近傍が残りの N-2 個のエージェントのうち k-1 個の追加エージェントに接続されている確率であり、次のように与えられる。 σ {\displaystyle \textstyle \sigma }   X { 0 1 } {\displaystyle \textstyle \X=\left\{0,1\right\}}   p 0 1 {\displaystyle \textstyle \p\in (0,1)}

質問 ; p 2 1 p 1 1 p 1 {\displaystyle \textstyle \mathbb {Q} (k;p)={N-2 \choose k-1}p^{(k-1)}(1-p)^{(Nk-1)}}

均衡状態において、次数kのエージェントが行動1を選択した場合、次数独立性(nが無限大であると仮定)から、次数k-1のエージェントは、任意の隣人が行動1を選択する確率が低く、同様に行動1を選択することが最善の対応となることが分かります。任意の均衡状態は閾値によって特徴付けられることが示されます。公共財が提供される最小の整数をtとします。   1 [ 1 1 t 質問 ; p ] t 1 c {\displaystyle \textstyle \1-{[1-\sum _{k=1}^{t}Q(k;p)]}^{t}\geq 1-c}

平衡点は、すべての に対してすべての および に対してを満たさなければなりません。特に、は非増加です。 σ {\displaystyle \textstyle \sigma } σ 1 {\displaystyle \textstyle \sigma (k)=1} < t {\displaystyle \textstyle k<t} σ 0 {\displaystyle \textstyle \sigma (k)=0} > t {\displaystyle \textstyle k>t}   σ t [ 0 1 ] {\displaystyle \textstyle \ \sigma (t)\in [0,1]} σ {\displaystyle \textstyle \sigma (k)}

基盤となるネットワーク構造、そしてネットワーク接続と行動の関係がゲームの結果に影響を与えることがわかります。社会的接続は個人的な優位性を生み出します。つまり、次数tを超えるプレイヤーは、次数t未満の接続が少ないプレイヤーと比較して、より高い期待利益を得ます

さらに読む

  • ミズーリ州ジャクソン、L. ヤリブ (2005) 「ソーシャル ネットワーク上の拡散」、Economie Publique 16(1): 3-16。
  • Jackson, MO、L. Yariv (2007)「ソーシャルネットワークにおける行動の拡散と均衡構造」アメリカ経済評論(論文および議事録)97(2):92-98。
  • Sundararajan, A. (2007)「ローカルネットワーク効果とネットワーク構造」BE Journal of Theoretical Economics 71(1):記事46。

参考文献

  1. ^ Song Y.とM. van der Schaar (2015)「不完全情報による動的ネットワーク形成」、経済理論、2015年6月、第59巻、第2号、pp.301-331。
  2. ^ Marit, J. および Y. Zenou (2014)「不完全情報によるネットワークゲーム」、NBERワーキングペーパー DP10290。
  3. ^ ab Jackson MO (2008)、「社会経済ネットワーク」、プリンストン、ニュージャージー州:プリンストン大学出版局。
  4. ^ Galeotti, A., S. Goyal, MO Jackson, F. Vega-Redondo (2010)「ネットワークゲーム」Review of Economic Studies、77(1):218-244。
「https://en.wikipedia.org/w/index.php?title=Incomplete_information_network_game&oldid=1321780851」より取得