檢索: 帳戶 密碼
檢索 | 新用戶 | 加入最愛 | 本報PDF版 | | 簡體 
2006年6月1日 星期四
 您的位置: 文匯首頁 >> 副刊 >> 正文
【打印】 【投稿】 【推薦】 【關閉】

從納殊到奧曼 由不合作變合作


http://paper.wenweipo.com   [2006-06-01]
放大圖片

 John Nash

 很多人對奧曼的認識都是始於05年的諾貝爾經濟學獎,但在他之前已經有一位經濟學者同樣以博弈論獲得諾貝爾獎,而那個故事更被拍成電影。說到這裡,相信大家都猜到,那學者就是約翰.納殊(John Nash),而電影的片名是《有你終身美麗》(A Beautiful Mind)。

 奧曼獲獎後,很多人喜歡把兩位大師作比較。在個人成長方面,奧曼雖然言論偏激,但心理尚算正常,經歷未如納殊般精彩。在學術方面,雖然兩人同為博弈論大師,但兩人的研究進路和結論都大異其趣。

 一般認為,博弈論主要分為合作博弈和非合作博弈。兩者區別在於參與遊戲的玩家之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。因此,合作與非合作博弈間存在極大的不可通約性。

 非合作博弈中有一個著名的例子,稱為「囚徒困境」,其大意是:兩名同夥罪犯被關在不同的牢房中,分別接受警方盤問,若一人指證另一人,那人可獲得自由,但另一人則要判刑十年;若他們互相指證對方,則各判五年;相反他們互為對方隱瞞,則可導致警方證據不足,無法檢控。由局外人看,互相隱瞞符合他們最大利益,但由於他們分開囚禁,無法得悉對方的選擇,為了保護自己,他們最終會選擇指證對方。這種非零和博弈的結果可稱為「納殊均衡」(Nash Equilibrium)或「非合作均衡」。

 面對「囚徒困境」,奧曼提出若故事只發生一次,囚犯當然會選擇互相出賣,但若這個故事不斷重演─兩名囚犯多次面對同一情況及每次都吃苦頭,最終會意識到,最好的選擇就是互相隱瞞,以確保雙方的最大利益。這種「重複博弈」的結果稱為「策略均衡」(Strategic Equilibrium),是奧曼對博弈理論的主要貢獻。他更指出重複博弈是連繫非合作博弈通向合作博弈的橋樑。

【打印】 【投稿】 【推薦】 【上一條】 【回頁頂】 【下一條】 【關閉】
副刊

新聞專題

更多