放大圖片
■湯曉鷗指,模式識別技術擺脫依靠文字搜索圖片的局限,依據圖片中物體的顏色、紋理、面積及輪廓等,尋找類似的其他圖片。 本報記者莫雪芝 攝
【本報訊】(記者 覃卓嘉)不少人都有透過網絡搜尋圖片,卻始終無法找到理想結果的痛苦經歷。其中一個原因,就是由於現時的網上搜尋器,都只能透過圖片的文字標注進行「間接」尋找,當中結果夾雜著大量文字標注相似,但畫面並不相關圖片,影響搜尋效率。不過,有關「缺陷」如今有望靠中文大學訊息工程學系教授湯曉鷗一項模式識別(Pattern Recognition)技術解決,其技術能革新地讓網絡系統按照指示,「直接」分析圖片中的顏色、形狀、紋理及輪廓等,找出與其類似的圖像,令圖片搜索更為方便及準確。而其技術已獲微軟MSN搜尋器採用,所有人均能上網親身使用作初步體驗。
湯曉鷗教授表示,以往的圖片搜尋器,都必須透過圖片的文字標注來尋找目標,如輸入「Lincoln」一詞時,由於文字標注相同,不但前美國總統林肯的圖像會出現,名為Lincoln的轎車圖片亦會同時夾雜在其中;相反,若圖片沒有被標注,則永遠不會被搜索到。
識別影像顏色紋理輪廓
為彌補這缺陷,湯曉鷗所在的訊息工程學系與微軟公司合作,於2007年起研究發展模式識別技術,讓電腦通過識別一張圖片中物體的顏色、紋理、面積及輪廓等,經過分析、判斷並尋找到與同類別,具相似特徵的另一張或多張圖片。該這種技術已在剛過去的2008年底被微軟網站正式採用。
至於具體應用情況,湯曉鷗舉例指,使用者可於相關的網上搜尋器先輸入Lincoln字眼,初步搜索後,林肯及轎車圖片會同時出現,此時可再任意在一張轎車圖片下方點擊「顯示類似圖片」功能,即會啟動第二輪的自動分析,就此類轎車的形狀、顏色、紋路等作歸類,結果便會集中在「Lincoln轎車」圖片;同樣道理,若輸入「蘋果」,水果蘋果及蘋果電腦的圖片均會出現,第二輪搜尋即可將結果集中於其中一方,搜尋方便度及準確率都有所提高。
未來或可過濾色情網站
不過,他坦言,目前的網上搜尋技術仍只能以文字為主導,圖像為輔,暫仍未能在網上進行純粹的「圖像配圖像」搜尋,但這亦正是學者需要突破的方向之一。他說:「未來或可以輸入一個人的相片,再在不需要文字下直接在網上尋到其孖生兄弟的相片,但短期內應難以做到。」
湯曉鷗又表示,有關技術理論上亦能應用於過濾色情網站上,因為系統能分析網站上的圖片,若發現有大量顏色、輪廓均與人體皮膚或各身體部位相似的「疑似色情圖像」,即可作過濾,不過具體應用仍需要作進一步研究。
視頻新技術添網聊樂趣
此外,湯曉鷗負責的另一個視頻處理技術,亦被微軟公司採納。依據此技術研發出的一套可使用與視頻聊天的娛樂軟件,能準確追蹤人臉不同角度的移動,並按使用者的選擇,在人臉上加上帽子、面具、哈哈鏡等特別效果,更可以「整形」五官或整個面容,亦可將人變瘦、變胖,為視像對話增添娛樂性。而他亦因上述2種技術,獲國際電機及電子工程師學會IEEE推選為院士,學術地位獲肯定。
|