放大圖片
【本報訊】(記者 覃卓嘉)科學化的數據調查於現今社會不可或缺,被廣泛應用於人口統計、醫學研究、民生與政治議題分析等各方面,而當中經常牽涉到研究對象的個人資料,如何保障當中的私隱安全,成為新興的課題。中文大學計算機科學與工程學系博士畢業生蕭小奎(小圖),成功開發新技術,可安全地將原始數據中某些涉及個人隱私部分做「修飾」,讓人難以還原或追蹤原文,達到保護私隱的目的。蕭小奎亦因此獲得香港科學會今年度的「青年科學家獎」。
蕭小奎05年開始於中大修讀博士學位,並進行「保護私隱的數據發布技術」的研究。他介紹稱,現行的研究數據處理都先採用泛化(Generalization)概念或類似技術,再作公布,以隱藏當中的個人資料,如將研究對象的年齡由「20歲」改為「20至40歲年齡組」,「惟這傳統的方法令公布的數據變得不準確,從統計學去看,誤差率最高可達5成。」
誤差率申50%降至10%
在研究中,他以「解剖分析(Anatomy)」概念代替泛化,系統可根據用者需要,將原始數據作特別處理,如將年齡「20歲」化為「第一年齡組」,外界更難追蹤到原始資料,而在統計上又比使用泛化技術更精確,誤差可降至10%。他表示,新系統處理數據需時或稍長,但卻可按個人需要,更新、刪除或輸入如地址、收入等不同數據,更具靈活性。於中大博士畢業後,蕭小奎今年獲聘任新加坡南洋理工大學助理教授,目前正進一步完善有關系統,預計明年底可正式在網上推出相關軟件供免費下載。
|