logo 首頁 > 文匯報 > 國際 > 正文

準確度約7成 「b」「p」最難發音

2019-04-26

科學家多年前已得知人類說話是由大腦指揮,但過去一直集中研究大腦接收聲音後發出的訊號,期望把訊號複製成為言語,卻欠缺成效。美國科學家這次反其道而行,提取大腦在說話時發出的訊號,但坦言現時的合成器仍未完全成熟,只有約70%句子能讓一般人聽懂,在處理「b」和「p」等部分輔音時更出現極大困難。

科學家這次的合成器軟件運用機器學習演算法,收集實驗參加者讀出句子時,大腦發出的訊號,再與聲帶、嘴唇、舌頭等部位的活動對比,從而模擬發聲,被稱為「虛擬聲道」。

然而並非所有聲音都能讓合成器輕易分辨,按照現時測試結果,合成器較易發出「sh」、「z」等輔音,但「b」和「p」則難以清晰表達。不過參與研究的研究生沙爾捷指出,合成器能模擬人類說話的語調和節奏,相信聽者仍能分辨。

英國牛津大學神經學教授沃特金斯亦稱,雖然合成器的發音並非完全準確,但人類實際上可適應另一人的說話方式,故發音問題對日常溝通的影響不會非常嚴重。 ■綜合報道

讀文匯報PDF版面

新聞排行
圖集
視頻