放大圖片
■AlphaGo會分析取得優勢的棋步(右)。
李世石與電腦程式AlphaGo的世紀大戰,根據韓國棋院與Google DeepMind協商,比賽時間為今日、明日、周六、周日及下周二,地點是首爾四季酒店。比賽用時為每方2小時,每分鐘讀秒3次。棋局將採用中國圍棋規則,即黑子貼七目半。
DeepMind行政總裁哈薩比斯上月宣佈規則時,表示將營造與普通圍棋大賽一樣的對局環境。正式比賽時,首爾一名業餘六段棋士將擔任AlphaGo的「眼睛」及「手」,邊看顯示屏邊替它落子。比賽會在YouTube等網站直播,並提供韓語及英語講解。
自我訓練3000萬局
雖然AlphaGo月前已經因為擊敗歐洲圍棋冠軍樊麾而轟動國際,但外界對它的技術細節所知仍不多。美國圍棋軟件「黑暗森林」開發者田淵棟分析說,AlphaGo主要由幾個部分組成:1、走棋網絡,給定當前局面,預測或採樣下一步的走棋。2、快速走子,目標和1一樣,但在適當犧牲走棋品質的條件下,速度要比1快100倍。3、估值網絡,給定當前局面,估計是白勝還是黑勝。4,蒙特卡羅樹搜索,把以上這3個部分連起來,形成完整的系統。
簡而言之,即是AlphaGo擁有「自我學習」能力,早在戰勝樊麾之前,它已進行超過3,000萬局的自我訓練,不斷提升自身棋力,這也是李世石等一眾韓國棋手不敢看輕AlphaGo的最大原因。 ■韓聯社/新華社
|