有科學家研究大數據不同的應用範疇,也有人開發供一般採用的大數據工具。理工大學電子計算學系副教授盧至力,就以開發大數據分析工具為目的,讓不太懂得電腦的人都可用到,就像現時各式各樣的電腦軟件,人們即使不清楚背後原理,亦可有效運用並達到指定目的。
運用問題:數據既急又多
盧至力概括大數據運用時所面對的幾個問題,「就是數據很多、來得很急、有很多不同類型的數據,例如我們買東西,會有一行行的購買紀錄,包括何時及買了甚麼;而現在買完東西又會去網上社交平台說產品好不好,這不是單純一行行資料,而是一堆描述文字。但不同人的說話又會有不同分量,我和行政長官梁振英說的就完全不同,因為他有更多人關注,這點不是數據紀錄,也不是自由文字,而是人和人之間的網路圖,這就有3種資訊要看。傳統公司不懂得如何分析,我就做個系統,將麻煩東西收集起,讓他們更方便地進行分析。」
他希望能開發出數據工具,不同用家寫幾句東西,無論最終數據有多大,都可給出結果,「如果數據很多,我們可於伺服器多加100台機或1,000台機,替它自動化地做分析。」
但他坦言,大學做有關工具開發面對不少難題,「最困難是錢,此外我們的規模亦遠未及外面的大公司;大數據講的是幾百萬台機,大學做不到。所以我們傾向與企業合作,因為他們有硬件資源,但未必有人和技術,我們則相反。」 ■歐陽文倩
|