囚人のジレンマ実験

武器になる哲学 人生を生き抜くための哲学・思想のキーコンセプト50

 繰り返した場合どうなるかというのを初めて知ったので、興味深かったです。

 

P190

囚人のジレンマ」は、もともとは1950年、プリンストン大学の数学者アルバート・タッカーが講演の時に用いた一種の思考実験です。・・・

囚人のジレンマ」とは、次のような思考実験です。二人組の銀行強盗が警察に捕まって別々の部屋で取り調べを受けている。検察官は二人の容疑者に対して次のように迫ります。「もし、両者とも黙秘を続ければ証拠不十分で刑期は1年。二人とも自白すれば刑期は5年。相方が黙秘を続けているとき、お前が自白すれば捜査協力の礼としてお前は無罪放免、相方は刑期10年だ」と。

 このとき、二人の囚人はこのように考えるはずです。「もし相方が黙秘する場合、自分が自白すれば無罪放免、自分も黙秘すれば刑期1年で、この場合自白した方がいい。一方、相方が自白するのであれば、自分も自白すれば刑期は5年、自分が黙秘すれば刑期10年で、こちらの場合もやはり自白した方がいい。つまり相方が自白しようが黙秘しようが、こちらにとってはいずれの場合でも自白が合理的だ」と。結果的に、二人の囚人はそろって自白し、どちらも5年の刑を受けることになってしまうという話です。利得を最大化するための合理的な戦略を採用した結果、必ずしもプレイヤー全体での利得は最大化されないという話で、専門的には非ゼロ和ゲームといいます。

 ・・・実際の人間社会はそれほど単純ではなく、協調か裏切りかの選択を何度も繰り返すことになります。この「何度も繰り返す」という面を反映させて、社会における人間の意思決定へより深い示唆を与えてくれるのが、その名もズバリ「繰り返し囚人のジレンマ」と呼ばれるゲームです。

 このゲームでは、プレイヤーはそれぞれ「協調」と「裏切り」のカードを持っていて、合図と共に同時に相手にカードを見せ合います。もし二人とも裏切る場合、二人とも1万円の賞金を得る。もし二人とも協調すれば二人とも3万円の賞金を得る。もし一方が裏切り、他方が協調すれば裏切った側に5万円の賞金が与えられ、協調した側には何も与えられません。さて問題です。最も高い賞金を得るためには、どのような選択を行うべきなのでしょうか?

 このゲームは、そのシンプルさからは信じられないような大変な論争を巻き起こし、最終的にミシガン大学政治学者ロバート・アクセルロッドは、この「繰り返し囚人のジレンマ」をコンピューター同士に戦わせて、どのようなプログラムがもっとも高い利得を得るかをコンテストで競わせることにしました。このコンテストには、政治学、経済学、心理学、社会学などの分野から14名の専門家が練りに練ったコンピュータープログラムを引っ提げて参加し、アクセルロッドは、これに無作為に「協調」と「裏切り」を出力するランダム・プログラムを加えて総計15のプログラムによる総当たり戦を行わせました。実際には一試合につき200回の「囚人のジレンマ」ゲームを行い、それを計5試合行って平均獲得点を比較するということにしました。

 さて、その結果を見て関係者は大変驚いた。優勝したのが、応募されたプログラムの中でもっともシンプルな、たった三行のものだったからです。このプログラムはトロント大学の心理学者アナトール・ラパポートが作成したもので、具体的には、初回は「協調」を出し、二回目は前回の相手と同じものを出し、以下それをひたすら繰り返す、という極めてシンプルなものだったのです。

 実はこの実験には・・・いろいろと批判もあるのですが、それはちょっと横に置いておいて、当のアクセルロッドが整理した「このプログラムの強さのポイント」が興味深いので説明しましょう。

 第一に、このプログラムは自分からは決して裏切りません。まず協調し、相手が協調する限り協調し続けるという「いい奴」な戦略です。

 その上で、第二に、相手が裏切れば即座に裏切り返します。協調してばかりだと相手が裏切った際に損失が膨らみますが、即座にペナルティを向こうに与えるわけです。「いい奴」だけど、売られたケンカは買う、ということです。

 さらに、第三のポイントとして、裏切った相手が再び協調に戻れば、こちらも協調に戻るという「寛容さ」を持っています。終わったことは水に流して握手、というナイスガイな戦略です。最後に、このプログラムは、相手側からすると「こちらが裏切らない限りいい人だけど、こっちが裏切ると裏切る」ことが明白で、非常に単純でわかりやすく、予測しやすいという特徴があります。

 ・・・この非常に単純な戦略は大変堅固で、この数年後・・・統計解析を駆使して打ち手を出力するような高度なプログラムをも含む遥かに多くの競争相手と対戦しながら、やはり再度優勝しています。・・・