コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

利用者:ぐしー/sandbox/標準型ゲーム

標準型ゲーム (ひょうじゅんがたゲーム、: normal form game) とは、ゲーム理論におけるゲームの表現形式の一つであり、プレイヤー戦略利得の3つ組で表現されるゲームである。正規形ゲーム戦略型ゲーム(英: strategic form game)とも呼ばれる。標準型ゲームは協力非協力を問わずゲームを表現できる。ただし、通常はゲームの構造を明らかにするために、協力ゲームには特性関数型を用い、逐次手番の非協力ゲームには展開型を用いることが多く、標準型ゲームを用いるのは同時手番の非協力ゲームであることが多い[要出典]。プレイヤー及び戦略の数が有限のとき、ナッシュ均衡および摂動完全均衡プロパー均衡が混合戦略の範囲で存在する[1]

定義

[編集]

プレイヤーの数と戦略の数が有限有限ゲーム (英: finite games) である場合の定義の一例を挙げる[2]

一つの同じゲームに参与する主体をプレイヤー (英: players) といい、その数が n であるとき、プレイヤーそれぞれの立場を n 以下の自然数に対応付けて I = {1, 2, ... , n} でその集合を表す。各プレイヤー iI ごとの振る舞いの選択肢を(純粋)戦略 (英: (pure) strategies) と呼び、その集合を Si で表す。全プレイヤーの戦略の集合の直積 S = ∏iI Si(純粋)戦略空間 (英: (pure-)strategy space) という。これは起こりうる全プレイヤーの純粋戦略の組み合わせ、すなわちゲームの結果の全体であり、それぞれの戦略の組を(純粋)戦略プロファイル (英: (pure-)strategy profiles) という。ゲームの結果によってプレイヤーが得る利益を利得 (英: payoff) といい、各純粋戦略プロファイル sS と各プレイヤー i の利得との対応を(純粋戦略)利得関数 (英: (pure-strategy) payoff function) πi : S → ℝ で表す。全プレイヤーの利得関数の組 π : S → ℝn, s ↦ (πi(s))iI結合(純粋戦略)利得関数 (英: combined (pure-strategy) payoff function)という。通常、標準型ゲームは3つ組 G = (I, S, π) で表される。

同値な別の表現として G = (S1, S2, ... , Sn; π) が用いられることがある[3]

2人ゲームの利得双行列表現

[編集]

I = {1, 2} の場合は利得行列 (英: payoff matrices) の組でゲームを表現できる。プレイヤー i の戦略の数を mi とすると、プレイヤー i の利得行列とは Ai = (πi(h, k))m1×m2,(hS1,kS2) である[4]。特に、以下のように双行列 (英: bimatrix) で表すことが多い。

プレイヤー2
プレイヤー1
戦略1 戦略m2
戦略1 π1(1, 1), π2(1, 1) π1(1, m2), π2(1, m2)
戦略m1 π1(m1, 1), π2(m1, 1) π1(m1, m2), π2(m1, m2)

対称ゲームの場合、プレイヤー2の利得行列はプレイヤー1の利得行列の転置行列であるから、特に進化ゲーム理論などではプレイヤー1の利得行列のみでゲームを表すことがある[要出典]

混合拡張

[編集]

支配関係と支配戦略

[編集]

最適反応とナッシュ均衡

[編集]

その他の解概念

[編集]

他の表現形式との関係

[編集]
展開型ゲーム
特性関数型ゲーム

脚注

[編集]

注釈

[編集]

出典

[編集]
  1. ^ Weibull 1998, pp. 19, 25, 27.
  2. ^ weibull 1998, pp. 1–2.
  3. ^ Selten 1975
  4. ^ Weibull 1998, p. 2.

文献目録

[編集]
  • 渡辺, 隆裕『ゼミナール ゲーム理論入門』日本経済新聞出版、2008年4月7日。ISBN 978-4-532-13346-7 
  • Weibull, Jörgen『進化ゲームの理論』大和瀬達二 監訳、三澤哲也/赤尾健一/大阿久博/横尾昌紀 訳、文化書房博文社、1998年3月31日(原著1995年)。ISBN 4-8301-0820-7