從納殊到奧曼由不合作變合作

http://paper.wenweipo.com [2006-06-01]

放大圖片

　John Nash

　很多人對奧曼的認識都是始於05年的諾貝爾經濟學獎，但在他之前已經有一位經濟學者同樣以博弈論獲得諾貝爾獎，而那個故事更被拍成電影。說到這裡，相信大家都猜到，那學者就是約翰．納殊（John Nash），而電影的片名是《有你終身美麗》（A Beautiful Mind）。

　奧曼獲獎後，很多人喜歡把兩位大師作比較。在個人成長方面，奧曼雖然言論偏激，但心理尚算正常，經歷未如納殊般精彩。在學術方面，雖然兩人同為博弈論大師，但兩人的研究進路和結論都大異其趣。

　一般認為，博弈論主要分為合作博弈和非合作博弈。兩者區別在於參與遊戲的玩家之間有沒有一個具有約束力的協議，如果有，就是合作博弈，如果沒有，就是非合作博弈。因此，合作與非合作博弈間存在極大的不可通約性。

　非合作博弈中有一個著名的例子，稱為「囚徒困境」，其大意是：兩名同夥罪犯被關在不同的牢房中，分別接受警方盤問，若一人指證另一人，那人可獲得自由，但另一人則要判刑十年；若他們互相指證對方，則各判五年；相反他們互為對方隱瞞，則可導致警方證據不足，無法檢控。由局外人看，互相隱瞞符合他們最大利益，但由於他們分開囚禁，無法得悉對方的選擇，為了保護自己，他們最終會選擇指證對方。這種非零和博弈的結果可稱為「納殊均衡」（Nash Equilibrium）或「非合作均衡」。

　面對「囚徒困境」，奧曼提出若故事只發生一次，囚犯當然會選擇互相出賣，但若這個故事不斷重演─兩名囚犯多次面對同一情況及每次都吃苦頭，最終會意識到，最好的選擇就是互相隱瞞，以確保雙方的最大利益。這種「重複博弈」的結果稱為「策略均衡」（Strategic Equilibrium），是奧曼對博弈理論的主要貢獻。他更指出重複博弈是連繫非合作博弈通向合作博弈的橋樑。

【上一條】

【下一條】

【關閉】