Remove ads
ウィキペディアから
進化的安定戦略(しんかてきあんていせんりゃく、英: evolutionarily stable strategy、ESS)は、進化生物学およびゲーム理論の重要な概念で、ジョン・メイナード=スミスとジョージ・プライスによって1973年に提唱された[1]。
これは、生物の母集団の取る、「侵略されない戦略」の概念を基礎としている。仮に突然変異で対立遺伝子が発生し、別の戦略を取って他の生物に働きかけようとしても、母集団を侵略することはできず、逆に自然淘汰で排除されてしまうような戦略である。メイナード=スミスらはこの概念によってゲーム理論の有効性を広く示し、行動生態学、経済学、心理学などに影響を与えた。
具体例をもとに進化的安定性を説明する[2]。動物が交尾相手や餌といった資源を同じ種の個体と争う場合、互いに殺し合うような闘争を避け、威嚇などの儀式的な闘争をする事で決着をつける事がある。 こうした儀式的闘争が発達した原因として、進化的安定性の概念が登場する以前は、「闘争の際に殺し合いを行なう種は絶滅してしまうので、儀式的闘争をする種だけが生き残った」といった群淘汰的な理由づけ[3]がなされがちであった。
しかし自然選択の対象が個々の個体である事を考えると、群淘汰的な理由づけでは儀式的闘争が数多くの種で発達した事をうまく説明できない。また、実際の動物の闘争を観察すると、戦いがエスカレートして傷つけ合ったり殺し合ったりする事も珍しくない[2]事も前述した理由づけとは合致しない。
そこで、儀式的闘争のような現象を群淘汰に頼らず、生物進化の基本的な原則である「自然選択によって繁殖成功率が高い適応戦略が種に広がっていく」という事によって説明する為の枠組みが、本稿の主題である進化的安定性である。
話を簡単にするため、動物の戦略が「タカ戦略」と「ハト戦略」の2つのみからなる場合を考える。タカ戦略とは、闘争がエスカレートした場合に戦う戦略であり、ハト戦略は闘争がエスカレートした場合には逃げる戦略である。
もし同じ動物種に属する全ての個体が常にハト戦略を取るのであれば、儀式的なものであれ実際的なものであれ、闘争は生じないであろう。しかしこのような種に突然変異などによって生まれた、タカ戦略を取る個体が少しでも侵略してくれば、周囲にいるハト戦略の個体は全て逃げ出すわけだから、タカ戦略を持つ個体が圧倒的に有利となり、子孫を残す事で種にタカ戦略が広がる事となる。したがってハト戦略を取る個体だけからなる種は安定しない。
逆に全ての個体が常にタカ戦略を取るとすれば、闘争は常にエスカレートする。ここにハト戦略の個体が侵入してくると、他の個体が闘争により著しく疲弊している中、闘争から逃げているハト戦略の個体だけが有利となり、ハト戦略が種の中に広まっていく。したがってタカ戦略を取る個体だけからなる種もやはり安定しない。
こうして、ハト戦略の個体とタカ戦略の個体が混じり合った状態で種は安定する事になる。この状態では、闘争相手がハト戦略を取るかタカ戦略を取るかを見極める事が重要となる為、儀式的闘争が発達する事になる。
進化的安定性は、上で述べたような複数の戦略が入り混じった状態での安定性概念である。
前節で説明した例をはじめとして、生物による多くの駆け引きは、自身の利得を最大化しようとする個体の同士による一種のゲーム(進化ゲーム)とみなす事ができる為、生物の駆け引きをゲーム理論により記述する事ができる。
進化的安定性の概念もゲーム理論の枠組みで記述でき、その定式化にはゲーム理論における混合戦略の概念が有用となる。
前節で説明した例を使って説明すると、闘争が必要になった時、各個体が取りうる選択肢として、「タカ戦略」と「ハト戦略」という二種類の戦略(純粋戦略)があった。しかし各個体はこれらの純粋戦略のうちひとつを常に取り続けるわけではなく、「30%の確率でタカ戦略を取り、70%の確率でハト戦略を取る」といった戦略をも取りうる。
混合戦略とは、このように個々の純粋戦略の上に確率を付与した戦略を指す。進化的安定性の概念は、この混合戦略の概念に対して定式化される。
進化的安定性とは、何らかの混合戦略が集団の中で支配的になるための条件である。すなわち、混合戦略 σ が進化的に安定であるとは、直観的には、集団の中に戦略σがすでに広まっている状況下において、 別の混合戦略τ を取る個体が少数侵入してきたとしても、それが排除される事をいう。
より詳しく言うと、たとえσ に近い別の混合戦略 τ を取る個体群が集団に少数侵入してきたとしても、戦略σ を取る個体と戦略τを取る個体が2者間で戦った際、前者の個体の方がより高い利得が期待できるため、戦略τを取る個体は自然選択により、いつしか集団から消えてしまう、という事である。
進化的安定性はゲーム理論の概念に基づいて定式化することができる。そこで本節では、必要なゲーム理論の概念を導入し、次節で進化的安定性を定式化する。
進化的安定性を定義するには、まず個々の個体の利得をゲーム理論的に定義する必要がある。ゲーム理論において利得はほかの個体とゲームを行ったときに得られる実数値として定義され、得られる利得は自分が取った戦略と対戦相手がとった戦略の結果として決まる。
すなわち、純粋戦略i を取る個体P が、純粋戦略 j を取る別の個体Qとゲームを行ったとき、個体Pは利得と呼ばれる実数値
を獲得する。そしてi、jにを対応させる関数Eを個体Pに関する利得関数と呼ぶ。
利得関数はゲームが始まる前の段階で、外界の状況等により事前に定まっており、個々の個体が変えることはできない。個々の個体にできるのは、与えられた利得関数から得られる利得を最大化するよう自身の戦略を選ぶことだけである。
進化的安定性を定義する際には、全ての個体に対して同一の利得関数が適用される事が前提となる。したがって純粋戦略i を取る個体P が、純粋戦略 j を取る別の個体Qと戦った時、個体Qが得る利得を
とすると、
が任意のi、jに対して成立する事が要請される。利得関数がこのような性質を満たすゲームを対称なゲームという。
混合戦略を取る個体の利得は、純粋戦略に対する利得の期待値として定義される。すなわち、各個体が取りうる純粋戦略に1,..., n と番号をつけ、純粋戦略iを取る確率がpiである混合戦略をと書く事にすると、個体P 、Qがそれぞれ混合戦略、を取る際のPの利得は、
により定義される。
進化的安定性を定義するためのゲーム(進化ゲーム)は以下のようなものである。なお、このゲームはゲーム理論の言葉で言えば「対象な2人戦略型ゲーム」に相当する。
進化的安定性を定義するための進化ゲームでは、対戦する2個体A、Bが選択肢として取りうる純粋戦略1、2、…、および利得関数Eが「ゲームのルール」として事前に定まっている。そしてA、Bは以下の手順でゲームを行なう:
A、Bの目的は、自身の利得を最大化する事である。
前節でも述べたように、進化的安定性の文脈では全ての個体に対して同一の利得関数が適用される事が前提とされるため、上述したゲームにおいてA、Bが得られる利得はそれぞれ、と対称な形になっている。
上述した進化ゲームは、ゲームに参加する2個体A、B取りうる純粋戦略をそれぞれ行、列としてA、Bの利得を行列の形にまとめた利得表により特徴づけられる。
下に上げたのは、前述したタカ戦略、ハト戦略からなる進化ゲーム(タカハトゲーム)の利得表である[4]:
タカ | ハト | |
---|---|---|
タカ | ||
ハト |
ここでVは2個体が争っている資源(例えば餌)を得た時に得られる利得を表し、Cは闘争によって怪我を追う事による損失を表す。
また利得表で縦軸は個体Aの取る戦略、横軸は個体Bの戦略であり、表内の (○, △)は、A、Bの利得がそれぞれ○、△である事を意味する。例えば表の左下のマスにかかれている(0,V)は個体Aがハト戦略、個体Bがタカ戦略を取った時、A、Bの利得がそれぞれ0、Vである事を意味する。表の左上と右下で値が2で割られているのは、2個体で資源を分け合った為である。
最後に、進化的安定性を定義する際に記法を簡単にするため、混合戦略の「線形結合」を定義する。
以下、話を簡単にするため、各個体が取れる純粋戦略の種類が有限個である事を仮定するが、無限個の場合にも自然に定義を拡張できる。
まず、記号を定義する。各個体が取りうる純粋戦略に1,..., n と番号をつける。そして純粋戦略iを取る確率がpiである混合戦略をと書く事にする。
2つの混合戦略の、、および実数aとbが与えられた時、σ、ξのa、bによる線形結合を
により定義する。であれば、混合戦略の線形結合もまた、混合戦略である。
Eを利得関数とするとき、任意の混合戦略τ、σ、ξに対し、次が成立する事が簡単な計算により分かる:
有限個の純粋戦略を持つ戦略型ゲームの事を(利得表が有限サイズの行列の形に書けるので)行列ゲーム[注 1]といい、これはもっとも典型的な進化ゲームの一つである。本節では対称な行列ゲームに対する進化的安定性を3つの異なる視点から定義づける。これら3つの定義は対称な行列ゲームにおいては同値であるが、より一般的な進化ゲームにおいては必ずしも同値ではない。
対称な行列ゲームにおける進化的安定性は以下のように定義される[8][9]。
定義1(対称な行列ゲームにおける進化的安定性) ― Gを対称な行列ゲームとし、EをGの利得関数とする。 このとき、Gにおける混合戦略が進化的に安定であるとは、任意の混合戦略σに対し、 を満たす実数が存在し、を満たす任意の実数に対し、
が成立する事を言う。
定義1のε0を侵入障壁という。定義1では侵入障壁ε0が混合戦略σに依存する事を許容するバージョンの定義を採用したが、ε0がσに依存しないバージョンの定義も存在し、これを一様な侵入障壁をもつ進化的安定性(ESS with uniform invasion barrier)と呼ぶ[9]。一般には一様なもののほうがそうでないものより強い定義であり、純粋戦略が無限個あるゲームの場合には進化的安定であるにもかかわらず一様な侵入障壁をもつ進化的安定ではない混合戦略が存在する事が知られている[10]。しかし定義1で考えているゲーム(=有限個の純粋戦略を持つ対象な戦略型ゲーム)の範囲では、両者の定義は同値である[10][11]。
混合戦略を取る個体の集団に、混合戦略を取る個体群が侵入し、集団全体の中で後者の割合がεになったとする。このとき、対戦相手がランダムに選ばれるとすれば、混合戦略を取る個体の利得の期待値は
となり、定義1で登場する不等式の左辺と一致する。同様の理由により混合戦略を取る個体の利得の期待値は
となり、定義1で登場する不等式の右辺と一致する。
したがって定義1は混合戦略を取る個体群が以下の割合εだけ侵入したとしても、混合戦略を取る個体の利得の期待値の方が混合戦略を取る個体の利得の期待値よりも真に大きくなる事を示している[12]。
2つの混合戦略、の距離を
により定義するとき[13]、進化的安定性を以下のように異なる角度から特徴づける事ができる[11][13][14]:
定理2(進化的安定性の別定義との同値性) ― Gを対象な行列ゲームとし、EをGの利得関数とする。 このとき、Gにおける混合戦略が進化的に安定である必要十分条件は以下の性質(局所優位性、local superiority)を満たす事である: あるが存在し、任意の混合戦略に対し、
が成立する。
なお、上では距離を(2)式に従って定義したが、定理2に書いたESSの別定義で本質的なのは距離そのものではなく、距離から定まる位相構造なので[15]、(2)式の代わりに以下のℓ1距離
を用いて定義しても定理2のものと同値になる。
定理2に書いたESSの別定義はより広範な進化ゲームに対して進化的安定性の概念を一般化する場合に有益であり[16]、一般化のさせかたにより、neighborhood invader strategy、neighborhood superiorなどとも呼ばれる[16]。
定義1は進化的安定性の直観的な意味を自然に定式化したものになっているものの、この定義に基づいて混合戦略の進化的安定性を直接チェックするのは容易ではない。そこで進化的安定性をより簡単にチェックする事を可能にする、別の特徴付けを紹介する[1]:
定理3(進化的安定性の特徴づけ) ― Gを対称な行列ゲームとし、EをGの利得関数とする。 このとき、Gにおける混合戦略が進化的に安定である必要十分条件は、任意の混合戦略σに対して以下の2条件を両方とも満たす事である。
(1)式で示したように利得関数は線形性を満たすので、これを利用して定義1に登場する式の両辺を変形すると、
となる。したがって(A)式が成り立つ必要十分条件が定理3の2条件である事を示せばよい。
(必要性)(A)式で極限ε→0を取ると、均衡条件の式が得られる。またであれば、(A)式よりなので、ε≠0に対してこれを変形するととなり、安定条件が言える。
(十分性)定義1の式を変形すると、
であるので(B)式が成り立つことを示せば良い。
均衡条件より(B)式の左辺は0もしくは正である。 (B)式の左辺が0である場合、安定条件よりなので、
が成立する。より、これは(B)式の右辺が負である事を意味するので、(B)式が成立する。
それに対し、(B)式の左辺が正の場合、が0以下であれば、明らかに(B)式は成立する。一方が正であれば、
よりも小さい任意のに対し、(B)式は成立する。
与えられた混合戦略τに対し、を最大にする混合戦略ξをτの最適反応(best reply)という[17]。
均衡条件は、が自身の最適反応である事を意味しており、の最大値はである[17]。一方、安定条件は、を満たす、すなわちに対する最適反応のうち以外の混合戦略はを満たしている事を意味している[17]。
ゲーム理論における重要な均衡概念としてナッシュ均衡があり、進化的安定性はのナッシュ均衡性と関係がある。本項で考えているゲーム(2人対称戦略型ゲーム)の場合、混合戦略の組がナッシュ均衡であるとは任意の混合戦略σに対し、
が成立する事を言う。特に任意の混合戦略σに対して(3)式の不等号がイコールなしで成り立つ場合、は狭義ナッシュ均衡であるという。
定理4(ナッシュ均衡との関係) ― 任意の2人対称戦略型ゲームに対し、次が成立する:
前述したタカハトゲーム対して定理3を適用する事で次が成立する事が分かる[19]:
これまで本稿では、行列ゲームに対する進化的安定性を議論してきたが、行列ゲームは下記のような条件を満たす場合にしか現実世界の生物の闘争をモデル化できない:
しかし実際の生物学における応用では、以上の条件を満たさない事も多い:
本章の目標は上で述べたような、行列ゲームの範疇に収まらないより一般的なゲームに対して進化的安定性を定義する事である。
本節では上述した1,...,5の制約を外すための手法を順に述べていく。
まず1に関しては、ゲーム理論の言葉で言えば繰り返しゲームを考える必要がある、という事である。一回のゲームの利得と繰り返し行ったゲームの利得の平均値とを区別する為、一回のゲームの利得はこれまで通りで表し、繰り返し行ったゲームの利得の平均値をと表す事に事にする。
ゲームを行うたびに闘争相手が毎回異なると仮定できる場合には、繰り返しゲームの平均利得はと一致する(詳細後述)。一方、同一の闘争相手と何度もゲームを繰り返す場合はより複雑で、後退帰納法(有限繰り返しゲームの場合)やフォーク定理(無限繰り返しゲームの場合)など、ゲーム理論の手法を用いてを求める必要がある。
2および3に関しては、戦略空間(strategy space)という概念を導入する事で一般化を図る[20][21]。戦略空間とは、そのゲームにおいて各個体が取りうる戦略全体の集合の事である。例えば行列ゲームの場合は混合戦略全体の集合が戦略空間である。すなわち、
が戦略空間である。ここでnは取りうる純粋戦略の個数である。
また「個体の体長」のように連続量の純粋戦略が取れる(が闘争の際ランダムに体長を変える事はできないので混合戦略は取れない)ゲームの場合、戦略空間は正の実数全体の集合
である。一方「動物が行動を起こすまでの時間」のように純粋戦略は連続量であり、混合戦略も取りうるゲームの場合には、戦略空間は
である[22]。なお進化的安定性の議論では、戦略間の「近さ」の概念が定義できる事が望ましいので、戦略空間が位相空間である事を求める事も多い[21]。
4に関しては、個体vs.個体だけでなく個体vs.個体群(population)の闘争を考える事で一般化を図る[23]。個体群に属する個体数が有限である場合には数学的解析が難しくなるので、以下本説では個体数が無限であるものと仮定する[24]。より厳密に言うと、戦略空間Xに属する戦略σを取る個体の割合を[0,1]区間に属する実数として定義できるものと仮定する。現実には無限の個体を含む個体群は存在しないが、個体群に属する個体が十分大きい場合には、近似的にこのような仮定を置いて議論を進める事ができる。
個体群の各々の個体は戦略空間Xに属するいずれかの戦略を取る。個体群Πにおいて、「戦略σ1,...σm∈Xを(確率1で)取る個体の割合がそれぞれε1,...εmである」という状態を
もしくは
と表記し[25]、これをΠの個体群戦略(population strategy[26])と呼ぶ。個体群戦略と区別するため、個々の個体の戦略の事を強調して個体戦略(player strategy[26])と呼ぶ。
なお上の式における記号「δ」は、混合戦略の和「」と区別する為につけられた単なる記号であると解釈して差し支えない。この場合、上記の式は数学的には形式和である。しかしこのδをX上で定義されたディラックのデルタ関数であると解釈する事で、上式をX上の分布を表す式とみなす事もできる。
また上では個体群が有限個の戦略σ1,...σm∈Xのいずれかしか取らない場合を考えたが、Xが性質のよい空間であれば無限個の戦略を取る場合も考える事ができる。しかし進化的安定性を定義する上では有限個の戦略を取る場合のみを考察すれば十分であるので、本稿では以下、無限個の戦略を取る場合は考えない。
本稿では個体群の性質として主として考えるのは個体群戦略のみなので、紛れがなければ個体群Πとその個体群戦略とで記号を混用し、
という表記も用いるものとする。
5で述べたように実際の生物では2つの個体の立場が非対称なゲームも起こりうるが、進化ゲーム理論では2つの個体が対称な場合のみに対して進化的安定性を定義し[27]、非対称なゲームには対称化を施す事により対称なゲームに対する進化的安定性の概念を利用する。例えば「オス」と「メス」という2つの立場がある状況では、個体が受精した際「オス」か「メス」かをランダムに選べる事を考慮する事により、全ての個体が「オス」になる可能性も「メス」になる可能性もある対称なゲームとして定式化する。
そこで本章では以下、対称なゲームに対する進化的安定性のみを議論するものとし、非対称なゲームに対する進化的安定性は後の章で議論するものとする。
以上までで述べた一般的なフレームワークにおける進化的安定性の定義を述べる前に、行列ゲームを上述のフレームワークにおいて再定式化する。このためにn通りの純粋戦略1,...,nが取れる行列ゲームを考え、その利得関数をEとする。さらにΠを個体群とし、Pを個体群Πの中にいる一匹の個体とし、Pが取る混合戦略をとする。
前章で述べた行列ゲームでは、Pは個体群Πの中のいずれか一匹の個体と一度だけゲームを行う事を前提としていた。しかし本章で述べる一般的フレームワークにおいては、Πの中の複数の個体と闘争する事を前提としている。より正確に言うと、定数kを固定し、以下のようなゲームをk回繰り返す:
そしてこのようなゲームにおけるPの平均利得をと表記する(ここで我々は前節で述べたように記号を混用して個体群Πの個体群戦略にもΠという記号を用いている)。
Πの個体群戦略が混合戦略τにより
と書けるとき、Pの対戦相手Qの戦略は確率εでσであり、確率1-εでτである。行列ゲームはk回行われるが、我々は個体群Πには無限に多い個体が含まれていると仮定していたので(前述)、Pが同一の個体と複数回ゲームを行う事はありえない。よってk回の行列ゲームの平均利得は明らかに
を満たす[28]。すなわち行列ゲームの場合は複数回のゲームの平均利得と個体群戦略で考えようが、一回の行列ゲームの利得と1個体の混合戦略で考えようが実質的な差はない。
しかし行列ゲーム以外のゲームではこのような単純な関係が成立するとは限らず、そもそも「2個体間の一回のゲームの利得」が定義できない場合もある(例えば、2個体間の闘争ではなくΠの全ての個体が闘争する場合)ので、本章で述べる一般的なフレームワークにおいて改めて進化的安定性の概念を定式化する必要がある。
以上の準備の元、進化的安定性の概念を一般化する。集合Xを一つ固定し、これを戦略空間と呼び、Xの元を戦略ないし個体戦略と呼ぶ。そして任意の戦略σ1,...σm∈Xに対し、形式和
を個体群戦略と呼ぶ。さらに戦略τと個体群戦略の組に利得と呼ばれる実数を対応させる関数
を一つ固定し、この関数を利得関数と呼ぶ。直感的にはの第一変数の個体戦略を取るある個体Pが、個体群戦略を取る個体群の中で(一般には複数回)闘争したときのPが得られる利得(ないしその平均値)がになるという事である。
以上のフレームワークにおいて、ゲームは戦略空間Xと利得関数の組として定義される。
ゲームに関する進化的安定性は以下のように定義される[29]:
定義G1(進化的安定性) ― を個体戦略とする。このとき個体戦略がに関してより進化的に安定であるとは、 を満たす実数が存在し、を満たす任意の実数に対し、
が成立する事を言う。
特にがに関して任意のより進化的に安定であるとき、はに関して進化的に安定であるという。
上の定義ではε0はσに依存する事を許容しているが、σに依存しないε0が取れる場合には、一様な侵入障壁をもつ進化的安定性(ESS with uniform invasion barrier)と呼ぶ[30]。
の定義より、任意の戦略はのように個体戦略としての第一変数としてする事も、のように個体群戦略としての第二変数として登場する事も可能である。したがって「オス」と「メス」のように立場の異なる個体が存在したとしても、第一変数を「オス」の戦略、第二変数を「メス」の戦略といったふうに2つの変数を使い分ける事はできない。すなわち前述したように、立場の異なる個体間の非対称なゲームに対する進化的安定性を上記の定義では記述できず、何らかの「対称化」の操作を行う事によって非対称ゲームを記述する必要がある。対称化に関しては後の章でより詳しく説明する。
すでに述べたように行列ゲームでは
という単純な関係があり、しかも行列ゲームの利得関数は行列を用いて簡単に表記できるので、線形性
が成立した。
しかしこうした性質は行列ゲーム以外のゲームでは必ずしも成立するとは限らない。実際我々は現段階では一般のゲームにおけるには一切仮定をおいていない為、線形性どころか連続性すら成り立つとは限らない。
このため行列ゲームに対して示した性質は一般のゲームに対しては無条件に成り立つとは限らず、線形性など何らかの仮定をおいた上でこうした性質(の類似物)を示す必要がある。
そこで本節では、線形性などに関する性質をいくつか導入し、これらの性質を元に進化的安定性の満たす性質を示す。
本節ではの線形性の概念を定義する。
行列ゲームにおける混合戦略のように、戦略空間上に線形和が定義できる場合には、左線形性も同様に定義できる:
定義G3(個体戦略に関する線形性) ― 任意の自然数m、 任意の個体戦略、 とを満たす任意の実数、および任意の個体群戦略 に対し、が
を満たすとき、は個体戦略に関して線形である、もしくは左線形であるという[31]。
これら2つの性質は行列ゲームの場合は明らかに満たされる。
多くのゲームにおいて、戦略空間Xは行列ゲームの場合と同様、何らかの混合戦略全体の空間であり、混合戦略の利得はのように純粋戦略の利得の期待値として定義されるので、個体戦略に対する線形性は多くのゲームで成立する[32]。
それに対し個体群戦略に対する線形性は満たさないゲームも多く、例えば以下の3つの状況では満たされない事が多い:
2013年現在、「線形性が満たされないゲームに関する一般的な理論はまだ十分に発展しているとは言い難い」[32]状況にあり、個別のゲームに応じた議論を行う必要がある。
行列ゲームにおける戦略空間Xは混合戦略全体の集合なので、戦略同士の線形和が定義できる。このように戦略空間X上に何らかの和の概念が定義できている場合、以下の概念を定式化できる:
定義G4(多型-単型同値性) ― 任意の個体戦略と任意の個体群戦略 に対し、が
を満たすとき、は多型-単型同値(polymorphic-monomorphic equivalent)であるという[33]。
多型-単型同値性は行列ゲームでは明らかに成立する:
多型-単型同値性の直観的な意味を説明する。定義G4の式の左辺ではの第2変数がであるので、個体群の中には戦略を取る個体が割合だけ存在し、...、戦略を取る個体が割合だけ存在するという状況を左辺は意味している。一方右辺ではの第2変数がであるので、個体群に属する全ての個体が全く同一の戦略を取っている状況を右辺は意味している。
多型-単型同値性はが純粋戦略であるケースを考えると理解しやすい。上で述べた事から、定義G4の式の左辺は純粋戦略を取る個体が割合だけ存在し、...、純粋戦略を取る個体が割合だけ存在するという状況である。すなわち全ての個体は何らかの純粋戦略を取っており、個体毎にどの純粋戦略を取るのかが決まっている状況である。これは例えば、遺伝的多型により、個体が生まれた段階でどの純粋戦略を取るのかが決まる場合がこの状況に相当する。
一方、定義G4の式の右辺は、全ての個体が全く同一の混合戦略を取っている状況である。これは例えば、「混合戦略を取る事」が遺伝的に単型な形で刷り込まれており、ゲーム開始の段階でランダムにのうちどれかを行う場合がこの状況に相当する。
多型-単型同値性はこの多型のケースと単型のケースがの第一変数の戦略を取る個体Pの平均利得という観点から見るとこの「多型」の状況と「単型」の状況に差がない事を意味する。
Pの闘争相手がゲームのたびに個体群から毎回ランダムに選ばれるケース(個体群の個体数は無限大なのでこれは闘争相手が毎回異なる事を意味する)における繰り返し行列ゲームの場合には、明らかに多型-単型同値性が成立する。しかしゲームによっては多型-単型同値性が成り立たないものもあり、次章以降でそうしたゲームについて見る。
行列ゲームにおける進化的安定性の概念が均衡条件と安定条件により特徴づけられる事を定理3で見た。この定理は本章で述べた一般的なゲームに関する進化的安定性に対しては常に成立するわけではないが、適切な条件下では定理3の類似物を示す事が可能である。
前節までと同様、Xを戦略空間とし、をX上の個体戦略と個体群戦略に「利得」とよばれる実数値を対応させる関数とする。さらに戦略を固定し、インセンティブ関数を
により定義する[34]。ここでは0以上1以下の実数全体の集合である。このとき次が成立する[34]:
定理G5(一般的なゲームの進化的安定性の簡便な特徴づけ) ― がにおいて(右方)-偏微分可能であり、しかも
であるとする。このとき、σ*がに関してσより進化的安定である必要十分条件は以下の2条件が両方とも成立する事である:
多くの生物学上の応用では、
を満たすの集合は零集合(≒面積0の集合)であるので、上記偏微分が0になる確率が0である事を多くのケースでは仮定できる(これをgeneric payoff assumptionという[35])[注 2]。この仮定の元では進化的安定性は均衡条件と安定条件が両方成立する事とほとんど至る所で同値である。
本節では定理3と定理G5の関係を見るため、定理G5を行列ゲームに適用してみる。すでに述べたように行列ゲームでは
であり、は右線形かつ左線形であるので、インセンティブ関数は
である。よってε=0における偏微分は
である。定理G5の安定条件の仮定が成り立つ条件下では
本章では個体群ゲームというゲームを定義し、このゲームにおける進化的安定性の性質を述べる。
多くのゲームにおいて、戦略空間Xは行列ゲームの場合と同様、有限個の純粋戦略を混合した混合戦略全体の空間であり、混合戦略の利得は
のように純粋戦略の利得の期待値として定義される。ここでさらに多型-単型同値が成り立てば、任意の個体群戦略は
のようにたった一つの混合戦略により記述できる。ここでと定義すれば、
が成立する事になる。利得関数が上式のように書けるゲームが個体群ゲームである。
以上をまとめると次のようになる[36][37]。なお以下でΔnは(Eq-G1)式で定義される集合であり、直観的には有限個(n個)の純粋戦略を混合した混合戦略全体の空間を意味する。
定義P1(個体群ゲーム) ― 戦略空間XがΔnであり、しかも関数が存在し、任意の混合戦略に対し、利得関数が
を満たすゲームを個体群ゲーム(population game)という。
定理P2(個体群ゲームの必要十分条件) ― 記号n、Xを定義P1と同様に取り、利得関数が多型-単型同値を満たしているとする。 このとき、利得関数を持つゲームが個体群ゲームである必要十分条件はが左線形である事である。
行列ゲームでは個体Pが個体群Πからランダムに選ばれた個体Qと1:1の闘争を行うケース(1対1型[38])を想定していた。しかし生物学における実際の状況は、このようなPは1:1の闘争を行うものばかりではなく、Pが個体群Πに属する全ての他の個体と闘争しなければならないものも存在する。
このようなΠの全ての他の個体との闘争を行われる状況を場を通じる型[38](playing the field[39])という。例えば植物が種を飛散させる状況下では、近くにいる他の全ての個体と土地を争わなければならないので、場を通じる型の類型に属する[39]。
場を通じる型のセッティングでは、そもそも1:1の闘争は行われないので行列ゲームのような1:1の闘争を前提とした利得関数Eは定義できず、Eを使わずに直接を定義する必要がある事になる。
この際利用できるのが、個体群ゲームのフレームワークである[40][41]。定理P2で述べたように、左線形性や多型-単型同値などの条件が成立しさえすれば、場を通じる型の状況を個体群ゲームとして記述できるので、個体群ゲームは有益な概念である。
以下の2つの性質が成立する[42]:
定理P3(個体群ゲームのESSにおける一様な侵入障壁の存在性) ― 個体群ゲームの利得関数が戦略空間上連続な関数を用いて
と書け、しかもが多型-単型同値であれば、この個体群ゲームにおける進化的安定戦略は必ず一様な侵入障壁を持つ。
定理P4(個体群ゲームのESSにおける一様な侵入障壁の存在性) ― 個体群ゲームの利得関数が戦略空間上連続な関数を用いて
と書け、しかもが多型-単型同値であるとする。 このときが進化的安定である必要十分条件は以下の性質(局所優位性、local superiority)を満たす事である: あるが存在し、Xの任意の元に対し、
これまで全ての個体が対等である状況を考察してきたが、実際の生物学では「オス vs. メス」、「テリトリーの所有者 vs. テリトリーへの侵入者」、「体の大きい個体 vs. 体の小さい個体」のように2つの非対称な立場がある個体同士が闘争する。しかし前章でも述べたように、進化ゲーム理論ではこうした非対称なゲームに関しては何らかの「対称化」を施すことにより、対象なゲームとして進化的安定性を定義する[27]。
本節では非対称なゲームを定式化し、対称化を方法を述べる。今各個体には2つの立場[38](role)があり、どちらの立場にいるかにより取れる戦略が異なるものとする。立場0、立場1にいる時に取れる戦略全体の集合をそれぞれX0、X1と表記する。このとき、非対称なゲームの戦略空間は
である。戦略空間の元の直観的意味は「もし自分が立場0であれば戦略σを取り、立場1であれば戦略τを取る」というものである。
このゲームにおける個体群戦略はと()を用いて
と書けるものを指す。ゲームは非対称であるので、利得関数も自分が立場0にいるときと立場1にいるときで異なる。自分が立場にいるときの利得関数を
と書く。ここでξはXkの元であり、はの元である。非対称なゲームは組
により定義される。
以上のように定義された非対称なゲームに対し、利得関数の対称化を行う。このために記号を導入する。個体群戦略
に対し、
と書くことにする。関数
を一つ固定するとき、利得関数の組をにより対称化した利得関数を
により定義する[43]。直観的にはは個体戦略を取っている個体が立場0になる確率である。
なお、対称化が定数関数
を用いて行われた場合、この対称化は戦略-立場独立(strategy-role independent[43])であるという。
非対称なゲームに関する進化的安定性は、対称化したゲームの進化的安定性により定義する。すなわち個体戦略が進化的安定であるとは、戦略空間がであり利得関数がであるゲームに関して進化的安定である事を指す[43]。もちろんこの進化的安定性の概念は関数に依存しており、が異なれば進化的安定性の概念も異なる。
これまで非対称なゲームを考察するに当たって、同じ立場にいる個体同士が闘争しないことを暗に仮定していた。すなわち、自分が立場0にいる時は立場1にいる個体と闘争し、立場1にいるときは立場0にいる個体と闘争する、という事である。しかし一般にはこれが成立しない場合もある。この場合には、4つの利得関数を考え、
として対称化をはかる[44]。ここではを満たす関数である。
直観的にはは自分が立場i、闘争相手が立場jにいるときの利得関数で、は自分が個体戦略を取っている際に、自分が立場i、闘争相手が立場jになる確率である。
レプリケーターダイナミクス(replicator dynamics、自己複製子動学[45])は与えられた個体群内の各個体が取る戦略の頻度分布(すなわち、前章までの言葉で言えば個体群戦略)がどのように時間発展するかを定式化したモデルで、このモデルにおいて頻度分布の時間発展を記述する方程式をレプリケーター方程式(replicator equation)という。本節では「離散型」、「連続型」の2種類のレプリケーター方程式を紹介し、行列ゲームにおいて連続レプリケーター方程式の解の収束先と進化的安定性の関係を述べる。
本節では以下の2種類のレプリケーター方程式を紹介する:
離散レプリケーター方程式を定式化するために、以下のような個体群を考える:
この個体群において世代tで(純粋)戦略iを取る個体の割合をと表記すると、この個体群における戦略の分布
と記述できる[注 3]。
この個体群で戦略iを取る各個体の利得をと表記し、に関して以下の仮定を置く:
このように仮定すると、個体群のうち割合の個体が、それぞれの子供を残すのだから、世代t+1において戦略1, ..., nを取る個体の比率は
となる。ここで我々は
事を利用した。以上より世代世代t+1において戦略iを取る個体の割合は、以下の離散レプリケーター方程式に従う[46]:
|
ここで
である[46]。
分数は分母だと意味を持たないので、最後に離散レプリケーター方程式の分母について触れておく。離散レプリケーター方程式の直観的な意味から、利得の期待値は
を満たす必要がある。または割合であったのでであり、数学的帰納法により、離散レプリケーター方程式の分母が0になる世代tの直前までは
が成立する事も示せる。したがって離散レプリケーター方程式の分母が0になる場合、すなわち
の場合は、正の数の和が0である事になるので、
が成立する。これは各iに対し、かのいずれかが0である事を意味する。であれば、純粋戦略iを取る個体は絶滅した事になるので、任意のs>tに対し、である。またであれば、純粋戦略iを取る個体が世代tで残せた子供の数が0である事を意味するので、やはり任意のs>tに対し、である。結局、離散レプリケーター方程式の分母が0になるという事は個体群の全ての個体が絶滅した場合に相当する。
連続レプリケーター方程式を定式化する為、離散レプリケーター方程式の節の2~4の仮定と以下の1'の仮定を満たす個体群を考える:
前節同様、(純粋)戦略iを取る個体の割合をと表記し、とし、この個体群で戦略iを取る各個体の利得をと表記する。
利得に関して前節のものと似た以下の仮定を置く:
個体群に属する個体数が十分に大きいと仮定しているので、個体数N(t)はtに関して微分可能な連続量であるとみなして差し支えないので[46]、とすると、上述の仮定から、
が成立する[46]。記号を簡単にするため、時間微分をのようにドットで書くことにすると、(Eq-R1)とより、
が成立し、しかも(Eq-R1)から
でもあるので、以下の連続レプリケーター方程式が成立する[46]:
|
ここで
である[46]。なお、適切な条件下では離散レプリケーター方程式の極限として連続レプリケーター方程式が得られる事が知られている[46][47]。
本節の目標は、行列ゲームに対し、レプリケーター方程式の解が進化的安定な状態へと収束する条件を見る事である。なお、行列ゲーム以外のゲームに関してはこのような収束性は成り立つとは限らない[48]。その理由の一端は、(後述するように)レプリケーター方程式が純粋戦略のみを取る個体群を想定しているのに対し、進化的安定性の定義では混合戦略をも考慮する事が多いからである[48]。したがって単型-多型同値が成り立たない系では、レプリケーター方程式による解析と進化的安定性とが一致しない可能性がある[48]。
まず行列ゲームに対する連続レプリケーター方程式を記述する。n×nの行列とn行の縦ベクトルpに対し、積Apの第i行を
という記号で書くことにすると、利得関数が
と記述できる行列ゲームにおいて、純粋戦略iを取る個体の利得の期待値は明らかに
なので、行列ゲームにおける連続レプリケーター方程式は
本節では(Eq-R2)と進化的安定性の関係性を調べるため、(Eq-R2)に関する性質を述べる。まずは純粋戦略iを取る個体の割合であったから、の初期値は
の元である。(Eq-R2)は行列によって記述できる常微分方程式であるので、(少なくとも初期値の近傍では)解が存在し、しかもその解は一意である(Picard–Lindelöf theorem)[50]。
解の一意性から、(Eq-R2)における時間発展で2つの超平面
が保存される事を簡単に示せるので、以下が明らかに従う[51]:
ここから明らかに次の系が従う[51]:
系R2 ― (Eq-R2)の初期値がの内部 に属していれば任意の時刻tに対し、はに属している。
はコンパクトであるので、以上の性質と前述の解の局所的存在性・一意性から次が従う:
定理R3 ― (Eq-R2)は任意の初期値に対し、任意の時刻tにおいて解が一意に存在する。
次の事実も知られている[52]:
定理R4(行列ゲームの連続レプリケーター方程式と一般化されたロトカ・ヴォルテラの方程式との関係性) ― 写像
により、行列により記述される行列ゲームの連続レプリケーター方程式(Eq-R2)の解は一般化されたロトカ・ヴォルテラの方程式
の解に写る。ここで
(Eq-R2)と進化的安定性の関係を述べるため、以下の概念を定義する。なお以下で、は初期値がであるときの(Eq-R2)の(必ず存在する一意な)解である[51]:
定義R5 ― をの元とする。このとき
なお大域的安定性の定義での境界の点に対してへの収束性を求めないのは、定理R1で述べたように、の点は(Eq-R2)における時間発展でに留まり続ける為、に収束することはありえないからである[51]。
このとき次が成立する[51][48]。なおゲーム理論にも「フォーク定理」という名称の定理があるが、下のものはこれとは無関係の定理である[注 4]。
定理R6(進化ゲーム理論のフォーク定理) ― をの行列とし、利得関数が
で定義される行列ゲームを考え、さらにAを用いて(Eq-R2)のように定義される連続レプリケーター方程式を考え、さらにをの元とする。このとき
すでに述べたように行列ゲームにおいては
という関係性が成立するので、上述の定理から連続レプリケーター方程式の解と進化的安定性との関係がある程度わかる事になる。
また以下も成立する[48]:
定理R7 ― 定理R6と同様の状況の元、
これまで我々は、着目している個体が純粋戦略を取る場合の連続レプリケーター方程式に関して考察してきたが、より一般に、有限個の混合戦略を取る個体がそれぞれ割合で存在する個体群に対する連続レプリケーター方程式を考える事もできる[53]:
ここでは平均混合戦略[54]
(Eq-R3)においてm=2であれば、、、と略記すると、なので、(Eq-R3)に登場するm=2本の式はいずれも
に同値である事が簡単な計算から確かめられる[53]。このとき、次が成立する事が知られている[53]:
定理R8 ― 行列Aに関する行列ゲームにおいて混合戦略が混合戦略に対して進化的安定である必要十分条件は(Eq-R4)が漸近的に安定である事である。
混合戦略に関して考察する前に、まず本節では行列ゲームの純粋戦略に対する離散レプリケーターを導出する。純粋戦略iを取る個体の割合をと表記し、とし、この個体群で戦略iを取る各個体の利得をと表記する。
n×nの行列を用いて利得関数が
と書ける行列ゲームにおいて、純粋戦略iを取る個体の利得の期待値は明らかに
なので、これを利用して離散レプリケーター方程式の具体的な形を書き下す事ができる。より一般に各個体が行列ゲームの利得以外に「背景利得」(background payoff)βを得られる場合、すなわち
の場合には、離散レプリケーター方程式の具体的な形は
連続レプリケーター方程式の「純粋戦略版」である(Eq-R2)から「混合戦略版」の(Eq-R3)を導いたのと同様の方法で、離散レプリケーター方程式の「混合戦略版」を「純粋戦略版」である(Eq-R5)から導くことができる。
すなわち、有限個の混合戦略を取る個体が世代tにおいてそれぞれ割合だけ存在する個体群を考え、とするとき、混合戦略を取る個体の利得の期待値は平均混合戦略[54]
を用いて
と表記できるので、
となる。なお(Eq-R6)より明らかに比の等式
が成立する。ここで
である。上の比の等式は左辺に登場する分母が0である場合は意味を持たないが、前節でも述べたのと同様の議論により、が0になるのは混合戦略を取る個体が個体群から絶滅した事を意味するので、以降のsに関しては常にであるものと解釈する。
離散レプリケーター方程式と進化的安定性との関係を見るため、(Eq-R7)でm=2であるケースを考え、、、と略記すると、なので
である[54]。ここでEは(Eq-R7)のように定義されており、
であり、(Eq-R9)の左辺の分母が0である場合の解釈は前節と同様であるものとする。また離散レプリケーター方程式の利得は子供の数を示していたので、
が成立する事を仮定する。このとき、次が成立する[54]:
上述の定理は、個体群においてを取る個体の割合が進化的安定戦略の侵入障壁よりも小さい時は、世代を重ねる事でを取る個体の割合が0に収束していく事を意味する。
まず簡単なケースとして、あるにおいてが成立する場合を考える。(Eq-R9)の左辺の分母が0になったという事であり、この場合は以上の全てのtに対しであるとしていたので、明らかに目的の収束性が従う。よって以下、が全てのtに対して成立する場合のみを議論する。(Eq-R9)を変形すると、(Eq-R6)と同様の式
が従う。これをさらに変形して
を得る。(Eq-RP2)の分母は
を満たし、の場合は既に述べたようにs>tに対しであるので、以下
であるとしてよい。
次に我々は(Eq-RP2)式を利用する事で、が狭義単調減少であるための条件を調べる。区間に属するが単調減少であればは何らかの非負の実数に収束するので、我々が知りたかったの収束性に関する情報が得られるからである。
解析を簡単にするため、しばらくの間を仮定する。
狭義単調減少性を満たす必要十分条件は、(Eq-RP2)式の右辺がtによらず正になる事である。我々は(Eq-RP2)式の分母が正である事をすでに示した。したがって(Eq-RP2)式の右辺が正であるのは、の場合である。割合はを満たしており、我々はのケースを考えていたので、結局となる必要十分条件は
となる事である。の定義より、(Eq-RP3)式の左辺は
に等しい。前述のようにで、を仮定していたので、(Eq-RP3)が成立する必要十分条件は
となる事である。再びの定義より、上式が成り立つ必要十分条件は
が成立する事である。
以上の議論からであれば、である必要十分条件は(Eq-RP4)が成立する事である事がわかった。
よって特に、
が結論づけられる。
さて、仮定より、は進化的安定戦略のに対する参入障壁に対してを満たしていた。これはすなわちに対し(Eq-RP4)が成立する事を意味し、当然でもあるので、(Eq-RP5)より、が成立する。よって再び進化的安定性より(Eq-RP4)が成立し、も成立するので(Eq-RP5)より、も成立する。以下同様に考える事で数学的帰納法により、が任意のtに対して成立する事がわかる。すなわちは狭義単調減少である。
非負の単調減少列は収束するので、はt→∞の極限を持ち、である。
である事から、再び進化的安定性より
である。したがって
とすれば、
である。
より、
である。一方(Eq-RP1)の分母を払って極限を取ると
が成立する。であれば上式両辺をで割る事ができるが、割った結果は(Eq-RP6)と矛盾する。したがってのt→∞における極限はである事が結論付けられる。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.