2024年11月15日
長崎大学 熱帯医学研究所 国際保健学分野の伊東 啓 准教授は、国立遺伝学研究所 新分野創造センターの山道 真人 准教授と共に、社会における協力行動が環境中の資源量と相互作用する一般的なゲーム理論の数理モデルを解析し、複雑なフィードバックがもたらす結果を明らかにしました。
図1.環境フィードバックを含むゲーム理論モデルの構造 人々の行動が環境(資源量)に影響し、環境が人々の行動に影響するフィードバックを表現している。 |
ポイント |
■ ヒトを含むさまざまな生物では、他個体と協力する行動が広く見られる。個体が合理的に振る舞うと、集団全体にとっての最適な選択と一致しない「社会的ジレンマ」という葛藤がしばしば生じるにもかかわらず、なぜ協力行動は存在するか、という問いに答えるために、「進化ゲーム理論」が精力的に研究されてきた。
■ 社会的ジレンマの代表的な例として、「共有地の悲劇」がある。これは、誰もが自由に利用できる共有資源(放牧場・漁場など)を各自が利己的に奪い合うことで、資源が過剰に消耗・枯渇してしまう状況を指す。共有地の悲劇は、漁業経済学や保全生態学でよく調べられてきた。
■ 共有地の悲劇を回避するためには、協力行動と環境中の資源量が互いに影響し合う「環境フィードバック」を取り入れた進化ゲーム理論の枠組み(図1)が有効なアプローチとなる。しかし、先行研究は限られた社会的ジレンマの状況にのみ焦点を当てていた。
■ 本研究では、環境フィードバックを考慮した進化ゲーム理論のもとで、全ての社会的ジレンマを網羅した理論的枠組み(数理モデル)を構築した。これにより、初期状態に依存して協力が維持されて、共有地の悲劇を回避できる状況や、協力行動と資源量の間に周期的な変動が生じる状況など、複雑なフィードバック動態が幅広い条件のもとで起きることが明らかになった。
■ このような一般的なモデルで得られた成果をもとに、環境問題や公衆衛生の問題など、個別の社会問題に特化したモデルを構築・解析することで、生態系と社会の間にある複雑な相互作用についての理解が深まり、両者を望ましい方向へ誘導できるようになると期待される。
背 景 |
ヒトや生き物が「協力」するか、「裏切る」か、をどのように選択しているか理解するために、「進化ゲーム理論」が使われてきました。具体的には、自分と相手が互いに2つの行動(「協力」と「裏切り」)のどちらかを選んだとき、行動の組み合わせに応じた利得(図2)を得て、より多くの利得を得られる行動の頻度が集団中で増えていく(より有利な行動が生き残る、すなわち進化する)と考えます。
図2.進化ゲームの利得行列 R、 S、 T、 Pの値の大小関係から、集団内で協力者が占める割合の動態が導かれる。 |
進化ゲームの種類 |
例えば、「囚人のジレンマ」と呼ばれる有名な進化ゲームがあります。このゲームでは、二人とも得をする最も良い状態(互いに協力する)という選択肢が存在するにもかかわらず、自分と相手が互いに自分の利得を最大化しようと合理的に行動することで、二人とも損をする悪い状態(互いに裏切る)という選択肢が安定になり、そこから抜け出せなくなってしまいます(図3)。
図3.囚人のジレンマの構造 両者にとって良い状態(パレート最適)は協力だが、個人にとって合理的な行動(ナッシュ均衡)は裏 切りなので、裏切り行動が常に優位になり、最終的には全員が裏切り者になる(集団中の協力者の頻度 xがゼロになる:x = 0)。 |
裏切り行動が常に優位となる「囚人のジレンマ」以外には、協力行動と裏切り行動が集団中で共存する「チキン」ゲーム、初期状態に応じてどちらかが優位になる「スタグハント(鹿狩り)」ゲーム、協力行動が常に優位となる「トリビアル」ゲームの計4種類の進化ゲームが考えられます(図4)。
図4.社会的ジレンマと4つの進化ゲーム 「チキン」では、集団内の協力者の割合がある一定の値に落ち着く(負の頻度依存性)。「スタグハント」では、初期値に応じて全員が協力者または裏切り者になる(x = 0またはx = 1の双安定:正の頻度依存性)。「トリビアル」では、個人にとっての合理的な行動と二人にとっての良い状態が一致するため、社会的ジレンマが存在せず、最終的には全員が協力者になる(x = 1)。 |
環境フィードバックと進化ゲーム理論 |
近年、環境と協力行動の相互作用を理解するために、環境フィードバックを含む進化ゲームが提案されました。そこでは、環境中の資源量(n)が利得行列(図2)を変え、社会の中で協力行動をとる人の割合(x)に影響する一方で、協力行動をとる人の割合も資源量に影響を及ぼすという環境と協力行動の間のフィードバックが表現されています(図1)。
例えば、環境中の資源が多いときには、皆が裏切りがちですが(nが大きければ、xが減る)、裏切る人が多くなると資源が減ります(xが小さければ、nが減る)。資源が減ってくると、少ない資源を奪い合うよりも、協力して皆で分け合う方が利益を得られることになります(nが小さければ、xが増える)。そして、協力する人の割合が増えてくれば、資源も回復してくる(xが大きければ、nが増える)、というフィードバック動態が考えられます。先行研究では、環境中の資源が多いときには必ず「囚人のジレンマ」ゲームが起きて、常に裏切り行動が増えるという状況を想定していました。
しかし、現実の社会ではより多様なゲーム的状況が起きると予想されます。例えば、資源量が多いときでも、資源をめぐる奪い合いに必要な労力が大きい状況では、協力者と裏切り者が共存すると考えられます(「チキン」ゲーム)。また、二人が協力すれば大量の資源が手に入るが、裏切れば少量の資源が確実に入手できる状況では、初期状態次第で協力者が増えるか、裏切り者が増えるかが決まります(「スタグハント」ゲーム)。このように、資源量が多いときにいつも皆が裏切る「囚人のジレンマ」が起きているとは限りません。
この研究でやったこと |
本研究では、資源が多いときと少ないときに、それぞれ「囚人のジレンマ」「チキン」「スタグハント」「トリビアル」の4つの進化ゲームが起きる状況を考え、どのようなフィードバック動態が生じるか、数理モデルを解析しました。つまり、4×4=16通りの状況を想定して、環境フィードバックを含む進化ゲームを解析しました。
この研究で分かったこと |
その結果、環境における資源量(n)と社会における協力者の割合(x)の初期状態によっては、協力が失われて資源が完全に枯渇する(共有地の悲劇)という帰結もあれば、協力行動を保ちながら資源が維持される結末もありうることがわかりました(図5左)。このような初期値依存性は双安定性と呼ばれます。双安定性がある場合には、初期状態次第で共有地の悲劇が回避できるということになります。
そして、資源量と協力者の間に周期的な変動(振動動態)が起こりうることもわかりました(図5右)。これは、図1のように、資源が増えると協力が減り、資源が減ると協力が増えるという繰り返しが起きるという状況です。このような振動動態は、資源量が多いときに「囚人のジレンマ」ゲームを考慮した先行研究で示されていましたが、本研究によって、資源量が多いときに「スタグハント」ゲームや「チキン」ゲームを仮定した場合にも発生することが新たに分かりました。
図5.資源が少ないとき(n = 0)に「スタグハント」ゲーム、資源が多いとき(n = 1)に 「チキン」ゲームが起きる数理モデルで観察されるさまざまなフィードバック動態 (左)双安定、(右)周期的振動を伴う双安定 |
本研究で得られた結果から、社会の課題がどういった進化ゲームに分類できるのかを明らかにすることが、環境と協力行動の複雑なフィードバック動態の理解に非常に重要であることがわかります。
この成果に基づいてさらに研究を発展させることで、環境保全や天然資源の持続可能な管理、抗菌薬の過剰使用と病原体の薬剤耐性化、感染症の拡散とワクチン接種行動など、個々人の意思決定によって「環境」が変化し、環境の変化によって個人の意思決定がさらに影響されるような環境フィードバックがある状況において、環境と人間の行動が相互に影響を与え合う状況の理解に役立ち、両者を望ましい方向へ導けると期待されます。
論 文 |
Hiromu Ito & Masato Yamamichi. A complete classification of evolutionary games with environmental feedback. PNAS Nexus. 3(11): pgae455、 2024. DOI: 10.1093/pnasnexus/pgae455
謝 辞 |
本研究は、JSPS科研費17H04731、19K16223、19KK0262、 20KK0169、21H01575、21H02560、22H01713、 22H02688、22H04983、23KK0210、NIG-JOINT(96A2023、73A2024)、Australian Research Council (ARC) Discovery Project (DP220102040)の助成を受けたものです。