你也許還記得,進化穩定策略在衆多的種群策略中占有許多席位,也一直得到不錯的結果。
如果說“針鋒相對”是一種進化穩定策略,這便是說,“針鋒相對”策略在充滿“針鋒相對”策略的大環境下能得到不錯的結果。
這便是一種特殊的“強勁”。
作為進化論者,我們一直很想找到一種唯一的、可以直接決定結果的“強勁”。
為什麼這很重要呢?因為在達爾文主義的世界裡,成功并不是赢得金錢,而是獲得後裔。
對于一個達爾文主義者,一個成功的策略将是一個在種群策略中數量衆多的策略。
如果這個策略要保持成功,它必須在同類衆多時——也就是充滿了自身複制的大環境中得到特别好的結果。
阿克塞爾羅德又模仿自然選擇,進行了第三場競賽來尋找進化穩定策略。
事實上,他并沒有稱之為第三次競賽,因為他并沒有邀請新的參賽者,而隻是使用了第二次競賽中的63個策略。
但我覺得稱它為第三次競賽比較合适,它和前兩次“循環賽”有根本性的不同。
阿克塞爾羅德将這63個策略再次丢給計算機,來制造進化演替的“第一代”。
“第一代”的大環境中由這63個策略組成。
結束後,赢家不再得到“金錢”或者“分數”,而是與其完全相同的“後代”。
世世代代如此傳遞,一些策略逐漸變得數目稀少,甚至完全絕迹,另一些策略則數目衆多。
當環境中策略的比例變化,博弈中策略的出牌也在随之變化。
最終在1000代之後,種群不再變化,環境也沒有再改變,穩定的狀态已經形成。
在此之前,各種策略的命運起伏不定,正如我模拟的“騙子”、“傻瓜”和“斤斤計較者”的命運一樣。
一些策略在博弈開始便已經滅絕,大多數則在200代之後徹底滅絕。
在那些惡意策略中,有一兩個一開始蓬勃發展,但它們的繁榮正如我的模拟預測一樣,隻是昙花一現。
唯一活過200代的一個策略叫做“哈靈頓”(Harrington)。
它的數目在前150代中直線上升,而後逐漸減少,在1000代之後終于完全滅絕。
“哈靈頓”短期繁榮的原因跟我的“騙子”是一樣的。
當那些如“兩報還一報”之類的老實人(過于寬容)還在世時,它欺負它們以獲得發展。
但當這些老實人已經消失之後,“哈靈頓”失去了獵物,也跟随着它們的命運而滅絕。
剩下的策略都類似于“針鋒相對”,既善良又容易被煽動報複。
“針鋒相對”本身在第三輪競賽中,6次中有5次得了第一,重複其在第一、二次競賽時的好運。
另外5個雖善良但容易報複的策略則幾乎和“針鋒相對”一樣成功(在種群數目上),還有一個策略甚至赢了第6次博弈。
當所有惡意策略都滅絕後,所有的善良策略與“針鋒相對”都無法辨認彼此了,因為它們都很善良,隻是簡單與所有對手“合作”到底。
這種“無法辨認”情況使得“針鋒相對”在嚴格意義上不是一個真正的進化穩定策略,即使它看起來确實很像。
一個策略要成為進化穩定策略,當它是常見策略時,它不可被少數變異策略所同化。
雖然“針鋒相對”不會被任何惡意策略同化,但另一個善良策略則可能做到。
正如我們所看到的,在善意策略的群體裡,它們面目模糊,行為相同,始終合作。
因此,有一些其他善良策略,比如“永遠合作”這種選擇優勢不如“針鋒相對”的策略,也可以溜進種群裡而不被發現。
所以嚴格地說,“針鋒相對”并不是進化穩定策略。
你也許會認為,如果世界充滿善良,我們便可以認為“針鋒相對”是一個進化穩