返回

第十二章 好人終有好報 · 1

首頁
    給予報仇或寬恕。

    在這一個無限長的博弈裡,我們最重要的任務是:赢了“銀行家”,而不是對方。

     在10次博弈後,理論上我也許可以獲得最多5000美元,但隻有在你完全愚不可及、或者大公無私地每次都打出“合作”的時候,我才有可能每次都得到最高獎賞“背叛的誘惑”。

    在更實際一點兒的情況裡,我們各自都在10次對弈中打出“合作”,并各自從銀行家裡得到3000美元。

    這樣,我們并不需要特别大公無私,因為我們彼此都能從對方過往行為中,知道對方可以信任。

    我們事實上也在監管着對方的行為。

    還有另一個也可能發生的結果,我們彼此不信任對方,在10次對弈中都打出了“背叛”,銀行家則從每個人處得到了100美元。

    最可能發生的是,我們并不完全信任對方,打出了各種次序的“合作”與“背叛”,雙方都得到了并不多的金錢。

     在第十章中,那些互相從對方羽毛中捉出蜱蟲的鳥,正是進行一場“囚徒困境”的重複博弈。

    這怎麼進行呢?你記得,對于鳥來說,從自己身上清除蜱蟲非常重要,但它無法自己清除頭部,隻能依靠同伴來幫助它,而讓它同樣報答對方也是公平的。

    但這項工作耗費了許多時間精力,鳥類在這方面并不寬裕。

    如果某隻鳥能以欺騙方式從這個小圈子中逃出來,讓别人清除自己的蜱蟲,而拒絕互惠互利,它則能得到所有實惠,而不需支付任何代價。

    如果你将這些回報結果排列一下次序,你将發現這正是真實的“囚徒困境”博弈。

    互相合作以清除彼此的蜱蟲固然是好事,但還有着更好的誘惑促使你拒絕支付互惠的代價。

    互相背叛以拒絕清除蜱蟲固然不是好事,但也沒有比花精力幫别人除蟲而自己無人理睬更不好。

    表12–2展示了這個回報結果。

     zsdjy2 但這隻是一個例子。

    如果你繼續思考,你更會發現,從人類到動植物,生活中充滿了“囚徒困境”的重複博弈。

    植物?是的。

    記得我們談到策略時,我們沒有提到有意識的策略(但我們之後可能會提及),但我們提及了“梅納德·史密斯”的意識,這便是一種預定基因的策略。

    我們之後還會提到植物,動物甚至細菌,他們都在進行着“囚徒困境”的重複博弈。

    現在,先讓我們詳細探索一下,為何重複博弈如此重要。

     在簡單博弈裡,我們可以預見“背叛”是唯一的理性策略。

    但重複博弈并不相同,它提供了許多選擇範圍。

    簡單博弈裡隻有兩種策略,合作或是背叛。

    但重複博弈則可以有很多我們想象得到的策略,并沒有任何一個是絕對的最佳方案。

    比如“大部分時間合作,而在随機的1/10時間裡背叛”這個策略,便是成千上萬的策略裡中的一個。

    策略也可以基于過往曆史來作出決定。

    我的“斤斤計較者”正是一個例子。

    這種鳥對臉部有很好的記憶力,盡管它基本采取合作策略,但它也會背叛那些曾經背叛過它的對手。

    還有一些其他策略則可能更為寬容,或者有更短期的記憶。

     顯然,重複博弈裡可用的策略之多取決于我們的創造力。

    但我們能夠算出哪個是最佳方案嗎?阿克塞爾羅德也這麼問自己。

    他想出了一個很具娛樂性的方案:舉行一場競賽。

    他廣發通知,讓博弈論的專家們來提交策略。

    在這裡,策略指的是事先确定的行動規則,所以競争者可以用計算機語言編程加入博弈。

    阿克塞爾羅德總共收到了14個策略。

    為了得到更好的結果,他還加了第15個策略,取名為“随機”。

    這個策略隻是簡單地随機出“合作”或“背叛”牌,基本等于“無策略”。

    如果任何一個其他策略比“随機策略”的結果更壞,這一定是個非常差的策略。

     阿克塞爾羅德将這15個策略翻譯成一種常用的計算機語言,在一個大型計算機中設定這些策略互相博弈。

    每個策略輪流與其他策略(包括它自己)進行重複博弈。

    15個策略總共組成15×15=225個排列組合,在計算機上輪番進行。

    每一個組合需要進行200回合的博弈,所有輸赢累積計算,以得出最終的赢家。

    
上一頁 章節目錄 下一章
推薦內容