じじぃの「科学・芸術_898_カール・セーガン・囚人のジレンマ」

【思考実験】「囚人のジレンマ」を繰り返すと良い奴が最強に!?【心理戦】

動画 YouTube
https://www.youtube.com/watch?v=H9nGJXSjXrk

囚人のジレンマ

ウィキペディアWikipedia) より
囚人のジレンマ(prisoners' dilemma)とは、ゲーム理論におけるゲームの1つ。お互い協力する方が協力しないよりもよい結果になることが分かっていても、協力しない者が利益を得る状況では互いに協力しなくなる、というジレンマである。各個人が合理的に選択した結果(ナッシュ均衡)が社会全体にとって望ましい結果(パレート最適)にならないので、社会的ジレンマとも呼ばれる。
1950年に数学者のアルバート・タッカーが考案した。ランド研究所のメリル・フラッド(英語版)とメルビン・ドレシャー(英語版)の行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や自白にたとえたため、この名がついている。

                        • -

『百億の星と千億の生命』

カール・セーガン/著、滋賀陽子、松田良一/訳 新潮社 2004年発行

ゲームのルール より

今度は繰り返される囚人のジレンマを考える。2人のプレーヤーがこのようなゲームを連続して行うのだ。1回終わるたびに、彼らは自分の受けた処罰から相手がどのように主張したかが分かる。彼らはお互いの戦略(および性格)について経験を得る。彼らはべーむを重ねるにしたがって、罪を犯したことをいつも否定して協調することを学ぶだろうか? たとえ相手を裏切ることの見返りが大きいとしても?
協調と裏切りのどちらを試みるかは、直前のゲームやそれまでの一連のゲームがどうだったかによるだろう。過度に協調すると、相手のプレーヤーはあなたの人の良さを利用するだろう。過度に裏切ると、友人もしばしば裏切ることになろう。これはどちらにとっても悪いことだ。あなたの裏切りパターンは相手に与えられる情報であることをあなたは知っている。協調と裏切りの適切な混ぜ具合はどれくらいだろうか? 自然界における他の問題と同様に、どのように行動すべきかという問題も今や実験によって究明すべき対象となる。
     ・
あなたは初めうちは裏切るが、もし相手が1回でも協調するならば、その後のすべてのゲームで協調すべきだろうか? それとも初めのうちは協調するが、もし相手が1回でも裏切るならば、その後のすべてのゲームで裏切るべきだろうか? これらの戦略もまた敗北する。スポーツと違って相手がいつもあなたをやっつけようと躍起になっているとは限らないから。
多くのこのような勝ち抜き戦で最も効率的な戦略は、「しっぺ返し」と呼ばれるものだ。これはとても単純だ。あなたは協調することから始め、続く各々の対戦においては相手がその前の回に取った方法を単に真似る。裏切りを罰するが、ひとたび相手が強調すれば、過去のことは進んで水に流す。初めのうちはまあまあの成功が得られたに過ぎないように見える。しかし時間が経つにつれ、他の戦略は過度の親切または冷酷さから自滅し、この中庸の道は他を抜いて前へ出る。最初の動きが常に親切であることを除いてしっぺ返しは真鍮律と同一だ。それは直ちに(まさに次のゲームで)協調に報い、裏切りを罰し、あなたの戦略を完全に相手に対して明確にするという大きな長所を有する(戦略のあいまいさは致命的になり得るから)。

人生を律するルール

黄金律    人からしてほしいと思うことを人にもせよ。
銀律     人にしてほしくないと思うことを人にしてはならない。
真鍮律    人があなたにするが如く人にせよ。
鉄律     人にやられるより先にやりたいようにやってしまえ。
しっぺ返し  先ず人に協調せよ、その後、人があなたにするが如く人にせよ。
しっぺ返しを使うプレーヤーが何人か現われるようになると、彼らは共に順位が上がる。しっぺ返し戦略を取る人が成功するためには進んでお返しをしてくれる人を見つけてともに協調し合わなければならない。真鍮律が予期せず勝った最初の勝ち抜き戦のあと、何人かの熟練者はこの戦略が寛大すぎると考えた。次の勝ち抜き戦では、彼らはより頻繁に裏切ることによってこの戦略に付け込もうとした。しかし彼らは常に負けた。経験豊富な戦略家ですら寛大さと和解の力を過小評価する傾向があった。しっぺ返しはいろいろな傾向が興味深く混じり合っている。初期の友好、許す潔さ、恐れを知らない報復。このような勝ち抜き戦でのしっぺ返しの優位性はアクセルロッドによって詳しく述べられた。
     ・
この種の倫理規定はもともと懸命な立法者によって発明されたものではない。それらの出現は進化のはるかなる過去に遡る。それらは我々が人類になる以前から祖先の動物が身につけていたものだ。
囚人のジレンマはとても単純なゲームだ。しかし現実の生活はずっと複雑だ。私の父がりんごを鉛筆売りの男に渡すならば、父は見返りにりんごを得るという可能性が増すだろうか? 鉛筆売りの男からではない。私達は再び彼に会うことは決してないだろう。しかし、広範囲に及ぶ慈善活動は経済を改善し、父に昇給をもたらすだろうか? それとも私達は経済的な報酬からではなく、感情的にりんごを与えるのだろうか? 人類や国家というものもまた、非現実的な囚人のジレンマゲームのプレーヤーとは違って、代々の体質や文化的な体質を背負って相互作用に至るのだ。
しかし、囚人のジレンマの勝ち抜き戦で、それほどの長期戦にならずとも得られた主要な教訓は、戦略的な明快さが必要なこと、妬(ねた)みは自滅につながること、長期的な目標の方が短期的な目標よりも重要なこと、暴虐もお人よしも共に危険なこと、そして特に人生を律するルールを全般に対して実験的なら対象として取り組みこと、だ。ゲーム理論はまた、歴史をよく知ることは重要な生き残りの手段であることを示している。