雑記

"空間配置型 N人版囚人のジレンマゲーム "

http://www2.kke.co.jp/event/abs_competition/%98_%95%B6_Tamura.pdf
2001年の論文。
もう、20年前になるのね。


繰り返し囚人のジレンマ(Iterated Prisoner’s Dilemma: IPD)

Axelrod(1984)が行なった、二種類の戦略が繰り返し対戦トーナメントは有名である。このトーナメントでは TFT(Tit for Tat)戦略が二度にわたって優勝した為、TFT が IPDの最強戦略と解釈されてきた。


多数の戦略を実行した結果、生きのこったのは

Friedman
TFT
soft Friedman
T2FT
hard TFT
Pavlov
All-C

で、それ以外全滅、と。

All-C 常に協調。
All-D 常に裏切り。
Joss TFT 同様相手に裏切られると即座に裏切り返すが、相手が協調した後では必ず協調するのではなく、9 割協調して 1 割裏切る。
TFT Tit for Tat。最初は協調し、あとはオウム返し。相手が協調したら自分も協調し、裏切れば裏切り返す。
T2FT 堪忍袋。基本的に TFT だが、二回続けて裏切られないと裏切り返さない。
HardTFT TFT をやや厳しくする。初めの 2 回は協調。前 2 回のうち一度でも裏切られたら、裏切り返す。
Random 協調と裏切りを確率的にランダムに選択する。
2CforD 最初は協調し、相手が 2 度協調してきたら裏切る。
Tester 最初は裏切り、相手の出方を調べる。相手が裏切ったら次回自分は協調し、その後は TFT。相手が協調したら、次回次々回は協調、その後一回おきに裏切る。
Friedman 最初は協調。相手が一度ででも裏切ると、その後ずっと裏切り続ける。
SoftFriedman 最初は協調。相手が二度続けて裏切ると、その後ずっと裏切り続ける。
per-CD CDCDCD・・・と繰り返す。
per-DC DCDCDC・・・と繰り返す。
per-CDD CDDCDDCDD・・・と繰り返す。
per-CCD CCDCCDCCD・・・と繰り返す。
Pavlov

TFT 戦略は、ノイズによって協調と裏切りを交互に繰り返してしまう、All-C に対して搾取できない(常に協調)、といった欠点がある。これらを補う戦略として、Nowak and Sigmund(1993)が提唱した Pavlov 戦略の概要を表 3 に示す(有田(2000)より)。例えば、相手が協調することを期待して自分が協調を出したときに裏切られた、あるいは(相手が協調を出すと思って)裏切りを出したときに相手も裏切ってきたときは期待通りいかなかったケースである 。このような失敗の選択をしてしまったときに前回の選択を変更する。逆に前回自分が裏切りで相手が協調した場合はうまくいったので、手を変える必要はない。Pavlovはノイズに強い戦略といわれる。