>相互合作的獎賞>相互背叛的懲罰>失敗的代價。
(嚴格來說,這個博弈還有另一個條件:背叛的誘惑與失敗的代價的平均值不可高于相互合作的獎賞。
我們将在後邊附加條件裡提到這個原因。
)這四種結果總結于表12–1裡。
zsdjy1
那麼,為什麼這是一個“困境”?看看這張輸赢狀況的表格,想象一下我在與你博弈時腦海中盤旋着的想法。
我知道你隻有兩張牌:“合作”或者“背叛”。
讓我們按次序來想想。
如果你打出“背叛”(這表示我們将看向表格中的右邊一列),我能打出最好的牌也隻能是“背叛”。
雖然我也将接受相互背叛的懲罰,但我知道,如果選擇了“合作”,失敗者的代價隻會更高。
而如果你選擇了“合作”(看向左邊一列),我最好的結果也隻能是選擇“背叛”。
如果我們合作了,我們都能得到300美元;但如果我選擇背叛,我将得到更多——500美元。
這裡的結論是:無論你選擇哪張牌,我最好的選擇是:永遠背叛。
我已經運用我無懈可擊的邏輯算出,無論你如何選擇,我都必須“背叛”。
而你,也将算出同樣的結果。
于是當兩個理性的對手相對時,他們将同時背叛,而也将同時得到罰款,獲得一個較低的分數。
雖然每個人都心知肚明,如果他們彼此選擇“合作”,兩人都将得到較高的相互合作的獎賞(我們的例子裡是300美元)。
這就是為什麼這個博弈被稱為困境,自相矛盾得令人惱火。
這也就是為什麼人們開始提出必須有一個法律來對付這個問題。
“囚徒”來自一個特殊的、想象中的例子,上述例子中的現金被監獄的刑罰所取代。
兩個在監獄中的囚徒——姑且稱他們為彼得森與莫裡亞蒂,有共同犯罪的嫌疑。
囚徒們各自被關押在單獨的牢房裡,并各自被勸誘背叛他的同夥,以将所有犯罪證據栽贓于對方。
他們的結果将取決于兩個囚徒的行為,而雙方都不知道對方的選擇。
如果彼得森将所有罪過都推向莫裡亞蒂,而莫裡亞蒂始終保持沉默(與他從前的朋友、現在的叛徒合作),莫裡亞蒂将接受重罰,而彼得森則得以無罪釋放,享受背叛的誘惑。
如果兩人互相背叛,便都将獲罪,但可以因為供認不諱而得到輕判,這便是互相背叛的懲罰。
如果兩人互相與對方而不是當局合作,閉口不談過往,所得證據将不足以把兩人判以重罪,則兩人也都将得到輕判,得到互相合作的獎賞。
雖然将牢獄刑罰稱為“獎賞”有點兒奇怪,但比起漫長的鐵窗生涯,犯人們肯定會将此看做獎賞的。
你可以發現,雖然這裡的回報不是美元而是牢獄刑罰,這個博弈的主要特征依然保存着(看看四個結果可取性的排列順序)。
如果你将自己放在任何一個囚徒的位置上,假設兩人都以理性的自我利益為動機,你将看到兩人都隻能背叛對方,而同樣接受沉重的刑罰。
有沒有逃離困境的方法呢?雙方都知道,無論對方如何選擇,他們能做出的最好的選擇都是“背叛”。
但他們也都知道,如果雙方都選擇合作,任何一方都可以得到更多的好處。
如果……如果……如果能有一個辦法讓他們達成共識,能有一個辦法讓雙方都堅信對方可以被信任,不至于奔向那個自私的獎賞,能有一個方法來維持雙方共識……
在“囚徒困境”這個簡單博弈裡,沒有任何方法可以達成信任。
除非其中一方是一個虔誠的傻瓜,善良得根本不可能适應這個世界,這個博弈注定将以相互背叛、相互損傷而告終。
然而,這個博弈還有另一個版本:“重複博弈”的“囚徒困境”。
這個“重複博弈”更為複雜,但這個複雜性裡孕育着希望。
這個“重複博弈”隻是簡單将上述博弈與同一個對手無限次重複。
你我再次在“銀行家”面前左右相對,再次擁有手中的兩張牌:“合作”與“背叛”,我們再次各自打出一張牌,由銀行家根據上述規則給出獎賞與懲罰。
但這一次對弈不再是博弈的終結,我們撿起手中的牌,準備着下一輪。
下一輪的遊戲給予我們機會來重新建立信任與懷疑,實施對抗或和解,