香港文匯報訊(記者 歐陽文倩)人機圍棋大戰掀起全城的AI熱。究竟是次人機大戰有什麼意義、機械人是否終將戰勝人類、AI還有何應用?本報訪問了科技大學計算機科學及工程學系講座教授兼系主任楊強,向大家揭開AI之謎。
圍棋帶動科技突破
■楊強指出,圍棋是棋藝中最難的,變化種類多於整個宇宙中的原子,長久以來圍棋被認為不能用電腦解答。
■開發AlphaGo的DeepMind公司的創辦人熱愛圍棋和編程,一直想以圍棋去研究出「人工通用智能」(AGI),打破以往AI太單一的問題。
■Google收購DeepMind,首次將相關AI技術集結在一起,需要很大計算量,對硬件要求很高。如今AlphaGo勝出局數較多,堪稱躍進和突破。
AlphaGo主要技術
■卷積網絡(Convolutional Neuron Network,簡稱CNN)︰機器看棋盤時會把棋盤看成一堆數字,但會失去了人下棋的直覺。CNN把這種感覺找回來,把棋盤視為一幅畫,模擬人類的「棋感」。CNN是機器學習的模型,用了3,000萬個人類下棋的棋譜數據去訓練,可告訴系統棋盤對自己是否有利。
■蒙地卡羅樹搜索(Monte Carlo tree search,簡稱MCTS)︰可很快告訴AI在哪裡落子最好,依靠搜索並要假設對方的反應。但由於這可能性太多,所以MCTS很聰明地隨機抽樣,類似於將所有可能性展開,是一種隨機的賭博。
■強化學習︰因為人類下棋經驗有限,數據還不夠多,所以讓電腦與電腦對弈,輸的一方改進策略。AI用這個辦法產生很多新的訓練數據來增強自己,就像金庸小說中的周伯通左右互搏增進自己的武功。
唯一敗仗揭仍有漏洞
■楊強表示,李世石在第四局贏了AI,反映他找到了機器的弱點,也說明了機器的訓練數據還不夠。
■這可能是「左右互搏」的強化練習誤導了電腦,因為它的數據是自己和自己對弈,而非人類,所以當看到不熟悉的局面時,就被自己誤導了,這可能要3億甚至30億個數據才夠修正。
比賽反映人機下棋之別
■圍棋裡有個詞叫「定式」,即說明某個狀況要如何破解。人類靠背誦,電腦則會走出自己的定式,而不按人的定式,電腦的棋法就是它設定的參數。
■這次AlphaGo的頭三局棋,很多大師都說看不懂,感到很驚訝,而李世石可能是真的需要看這三局棋,去了解AlphaGo下棋模式。
■另外,很多圍棋大師不只要贏,還希望大勝,但電腦只想着贏就可以了。
AI思考方式異於人類
■楊強認為電腦可以思考,唯做法跟人類可能不同,而電腦涉及的網絡和人腦結構相似度也較低。現時的問題是,不能做到一個較通用的AI(即同一個算法),它既可理解語言和看到的東西,又可進行邏輯推理。人類經常做類比、有聯想能力,但電腦沒有。
人類勝在有意識
■有意見認為AI已比人類聰明,但楊強指出,現時機械人還是頗笨,例如工業機械人只能做特定的事情。這是有意識和沒有意識的區別,人類有意識、有動力做事情,但機器沒有這種動力。
■給予機器目標涵數,它可能做得比人好,但目標涵數還是由人來設定的,機器不會自己做,所以電腦的老師還是人類。
AlphaGo未來應用
■第一種是金融投資,金融買賣和下圍棋相似,是在跟「大勢」下棋。另一個相似特點是Delayed reward(延遲的回饋),就是你下一步棋後不知結果,可能要下到第一百步才知對錯,投資也是一樣。
■AI也可應用於醫療,因為一系列的治療手段,要到一段時間後才看到效果,可說是和人的身體下棋。
|