logo 首頁 > 文匯報 > 港聞 > 正文

【摸索前行】非公開數據難得

2016-12-27

「深度學習」一直被業界視為一個黑盒子,要深入研究往往有很多未知之數。過去多年王曉剛致力設計讓「深度學習」應用在人面識別系統的專用模型,期望「打開黑盒子」。過程中自然會有不少問號,「因為前人沒做過,我們實在不知道『深度學習』能做到什麼程度,相當於在黑暗中摸索一樣。」

王曉剛憶述,他的兩組學生在2012年開始利用深度學習,各自以不同的方法去研究人面識別系統,因互相競賽的關係,系統「認人」的準確率亦不斷提升,「比如一組做到了97%,另一組會更努力去解決困難,後來慢慢做到了99.53%,超越了肉眼水平。」

他又提到,在訓練電腦「學習」的過程中,需要龐大的數據量,「當你將人工智能的系統,當成是一個火箭,大數據就是火箭的燃料,網絡的結構就是火箭的發動機,所以你要有充足的燃料及發動機,火箭才能騰飛。」

不過,大學如何獲得非公開的數據卻是另一困難,「在數據較少的情況下,我們怎樣把通用模型遷移至數據比較少的系統應用,是很困難的。」 記者 鄭伊莎

讀文匯報PDF版面

新聞排行
圖集
視頻