採中國圍棋規則 AI「控制」業餘棋手

http://paper.wenweipo.com [2016-03-09]

放大圖片

■AlphaGo會分析取得優勢的棋步（右）。

李世石與電腦程式AlphaGo的世紀大戰，根據韓國棋院與Google DeepMind協商，比賽時間為今日、明日、周六、周日及下周二，地點是首爾四季酒店。比賽用時為每方2小時，每分鐘讀秒3次。棋局將採用中國圍棋規則，即黑子貼七目半。

DeepMind行政總裁哈薩比斯上月宣佈規則時，表示將營造與普通圍棋大賽一樣的對局環境。正式比賽時，首爾一名業餘六段棋士將擔任AlphaGo的「眼睛」及「手」，邊看顯示屏邊替它落子。比賽會在YouTube等網站直播，並提供韓語及英語講解。

自我訓練3000萬局

雖然AlphaGo月前已經因為擊敗歐洲圍棋冠軍樊麾而轟動國際，但外界對它的技術細節所知仍不多。美國圍棋軟件「黑暗森林」開發者田淵棟分析說，AlphaGo主要由幾個部分組成：1、走棋網絡，給定當前局面，預測或採樣下一步的走棋。2、快速走子，目標和1一樣，但在適當犧牲走棋品質的條件下，速度要比1快100倍。3、估值網絡，給定當前局面，估計是白勝還是黑勝。4，蒙特卡羅樹搜索，把以上這3個部分連起來，形成完整的系統。

簡而言之，即是AlphaGo擁有「自我學習」能力，早在戰勝樊麾之前，它已進行超過3,000萬局的自我訓練，不斷提升自身棋力，這也是李世石等一眾韓國棋手不敢看輕AlphaGo的最大原因。 ■韓聯社/新華社