給予報仇或寬恕。
在這一個無限長的博弈裡,我們最重要的任務是:赢了“銀行家”,而不是對方。
在10次博弈後,理論上我也許可以獲得最多5000美元,但隻有在你完全愚不可及、或者大公無私地每次都打出“合作”的時候,我才有可能每次都得到最高獎賞“背叛的誘惑”。
在更實際一點兒的情況裡,我們各自都在10次對弈中打出“合作”,并各自從銀行家裡得到3000美元。
這樣,我們并不需要特别大公無私,因為我們彼此都能從對方過往行為中,知道對方可以信任。
我們事實上也在監管着對方的行為。
還有另一個也可能發生的結果,我們彼此不信任對方,在10次對弈中都打出了“背叛”,銀行家則從每個人處得到了100美元。
最可能發生的是,我們并不完全信任對方,打出了各種次序的“合作”與“背叛”,雙方都得到了并不多的金錢。
在第十章中,那些互相從對方羽毛中捉出蜱蟲的鳥,正是進行一場“囚徒困境”的重複博弈。
這怎麼進行呢?你記得,對于鳥來說,從自己身上清除蜱蟲非常重要,但它無法自己清除頭部,隻能依靠同伴來幫助它,而讓它同樣報答對方也是公平的。
但這項工作耗費了許多時間精力,鳥類在這方面并不寬裕。
如果某隻鳥能以欺騙方式從這個小圈子中逃出來,讓别人清除自己的蜱蟲,而拒絕互惠互利,它則能得到所有實惠,而不需支付任何代價。
如果你将這些回報結果排列一下次序,你将發現這正是真實的“囚徒困境”博弈。
互相合作以清除彼此的蜱蟲固然是好事,但還有着更好的誘惑促使你拒絕支付互惠的代價。
互相背叛以拒絕清除蜱蟲固然不是好事,但也沒有比花精力幫别人除蟲而自己無人理睬更不好。
表12–2展示了這個回報結果。
zsdjy2
但這隻是一個例子。
如果你繼續思考,你更會發現,從人類到動植物,生活中充滿了“囚徒困境”的重複博弈。
植物?是的。
記得我們談到策略時,我們沒有提到有意識的策略(但我們之後可能會提及),但我們提及了“梅納德·史密斯”的意識,這便是一種預定基因的策略。
我們之後還會提到植物,動物甚至細菌,他們都在進行着“囚徒困境”的重複博弈。
現在,先讓我們詳細探索一下,為何重複博弈如此重要。
在簡單博弈裡,我們可以預見“背叛”是唯一的理性策略。
但重複博弈并不相同,它提供了許多選擇範圍。
簡單博弈裡隻有兩種策略,合作或是背叛。
但重複博弈則可以有很多我們想象得到的策略,并沒有任何一個是絕對的最佳方案。
比如“大部分時間合作,而在随機的1/10時間裡背叛”這個策略,便是成千上萬的策略裡中的一個。
策略也可以基于過往曆史來作出決定。
我的“斤斤計較者”正是一個例子。
這種鳥對臉部有很好的記憶力,盡管它基本采取合作策略,但它也會背叛那些曾經背叛過它的對手。
還有一些其他策略則可能更為寬容,或者有更短期的記憶。
顯然,重複博弈裡可用的策略之多取決于我們的創造力。
但我們能夠算出哪個是最佳方案嗎?阿克塞爾羅德也這麼問自己。
他想出了一個很具娛樂性的方案:舉行一場競賽。
他廣發通知,讓博弈論的專家們來提交策略。
在這裡,策略指的是事先确定的行動規則,所以競争者可以用計算機語言編程加入博弈。
阿克塞爾羅德總共收到了14個策略。
為了得到更好的結果,他還加了第15個策略,取名為“随機”。
這個策略隻是簡單地随機出“合作”或“背叛”牌,基本等于“無策略”。
如果任何一個其他策略比“随機策略”的結果更壞,這一定是個非常差的策略。
阿克塞爾羅德将這15個策略翻譯成一種常用的計算機語言,在一個大型計算機中設定這些策略互相博弈。
每個策略輪流與其他策略(包括它自己)進行重複博弈。
15個策略總共組成15×15=225個排列組合,在計算機上輪番進行。
每一個組合需要進行200回合的博弈,所有輸赢累積計算,以得出最終的赢家。