準確度約7成「b」「p」最難發音

2019-04-26

科學家多年前已得知人類說話是由大腦指揮，但過去一直集中研究大腦接收聲音後發出的訊號，期望把訊號複製成為言語，卻欠缺成效。美國科學家這次反其道而行，提取大腦在說話時發出的訊號，但坦言現時的合成器仍未完全成熟，只有約70%句子能讓一般人聽懂，在處理「b」和「p」等部分輔音時更出現極大困難。

科學家這次的合成器軟件運用機器學習演算法，收集實驗參加者讀出句子時，大腦發出的訊號，再與聲帶、嘴唇、舌頭等部位的活動對比，從而模擬發聲，被稱為「虛擬聲道」。

然而並非所有聲音都能讓合成器輕易分辨，按照現時測試結果，合成器較易發出「sh」、「z」等輔音，但「b」和「p」則難以清晰表達。不過參與研究的研究生沙爾捷指出，合成器能模擬人類說話的語調和節奏，相信聽者仍能分辨。

英國牛津大學神經學教授沃特金斯亦稱，雖然合成器的發音並非完全準確，但人類實際上可適應另一人的說話方式，故發音問題對日常溝通的影響不會非常嚴重。 ■綜合報道

新聞排行

圖集

視頻

準確度約7成 「b」「p」最難發音