自私的基因 - 第十二章好人終有好報 · 1第3頁 | 免費繁體小說線上閱讀

    給予報仇或寬恕。

    在這一個無限長的博弈裡，我們最重要的任務是：赢了“銀行家”，而不是對方。

     在10次博弈後，理論上我也許可以獲得最多5000美元，但隻有在你完全愚不可及、或者大公無私地每次都打出“合作”的時候，我才有可能每次都得到最高獎賞“背叛的誘惑”。

    在更實際一點兒的情況裡，我們各自都在10次對弈中打出“合作”，并各自從銀行家裡得到3000美元。

    這樣，我們并不需要特别大公無私，因為我們彼此都能從對方過往行為中，知道對方可以信任。

    我們事實上也在監管着對方的行為。

    還有另一個也可能發生的結果，我們彼此不信任對方，在10次對弈中都打出了“背叛”，銀行家則從每個人處得到了100美元。

    最可能發生的是，我們并不完全信任對方，打出了各種次序的“合作”與“背叛”，雙方都得到了并不多的金錢。

     在第十章中，那些互相從對方羽毛中捉出蜱蟲的鳥，正是進行一場“囚徒困境”的重複博弈。

    這怎麼進行呢？你記得，對于鳥來說，從自己身上清除蜱蟲非常重要，但它無法自己清除頭部，隻能依靠同伴來幫助它，而讓它同樣報答對方也是公平的。

    但這項工作耗費了許多時間精力，鳥類在這方面并不寬裕。

    如果某隻鳥能以欺騙方式從這個小圈子中逃出來，讓别人清除自己的蜱蟲，而拒絕互惠互利，它則能得到所有實惠，而不需支付任何代價。

    如果你将這些回報結果排列一下次序，你将發現這正是真實的“囚徒困境”博弈。

    互相合作以清除彼此的蜱蟲固然是好事，但還有着更好的誘惑促使你拒絕支付互惠的代價。

    互相背叛以拒絕清除蜱蟲固然不是好事，但也沒有比花精力幫别人除蟲而自己無人理睬更不好。

    表12–2展示了這個回報結果。

     zsdjy2 但這隻是一個例子。

    如果你繼續思考，你更會發現，從人類到動植物，生活中充滿了“囚徒困境”的重複博弈。

    植物？是的。

    記得我們談到策略時，我們沒有提到有意識的策略（但我們之後可能會提及），但我們提及了“梅納德·史密斯”的意識，這便是一種預定基因的策略。

    我們之後還會提到植物，動物甚至細菌，他們都在進行着“囚徒困境”的重複博弈。

    現在，先讓我們詳細探索一下，為何重複博弈如此重要。

     在簡單博弈裡，我們可以預見“背叛”是唯一的理性策略。

    但重複博弈并不相同，它提供了許多選擇範圍。

    簡單博弈裡隻有兩種策略，合作或是背叛。

    但重複博弈則可以有很多我們想象得到的策略，并沒有任何一個是絕對的最佳方案。

    比如“大部分時間合作，而在随機的1/10時間裡背叛”這個策略，便是成千上萬的策略裡中的一個。

    策略也可以基于過往曆史來作出決定。

    我的“斤斤計較者”正是一個例子。

    這種鳥對臉部有很好的記憶力，盡管它基本采取合作策略，但它也會背叛那些曾經背叛過它的對手。

    還有一些其他策略則可能更為寬容，或者有更短期的記憶。

     顯然，重複博弈裡可用的策略之多取決于我們的創造力。

    但我們能夠算出哪個是最佳方案嗎？阿克塞爾羅德也這麼問自己。

    他想出了一個很具娛樂性的方案：舉行一場競賽。

    他廣發通知，讓博弈論的專家們來提交策略。

    在這裡，策略指的是事先确定的行動規則，所以競争者可以用計算機語言編程加入博弈。

    阿克塞爾羅德總共收到了14個策略。

    為了得到更好的結果，他還加了第15個策略，取名為“随機”。

    這個策略隻是簡單地随機出“合作”或“背叛”牌，基本等于“無策略”。

    如果任何一個其他策略比“随機策略”的結果更壞，這一定是個非常差的策略。

     阿克塞爾羅德将這15個策略翻譯成一種常用的計算機語言，在一個大型計算機中設定這些策略互相博弈。

    每個策略輪流與其他策略（包括它自己）進行重複博弈。

    15個策略總共組成15×15=225個排列組合，在計算機上輪番進行。

    每一個組合需要進行200回合的博弈，所有輸赢累積計算，以得出最終的赢家。

第十二章 好人終有好報 · 1

第十二章好人終有好報 · 1