Google 開發 AI 翻譯系統   可模擬用戶聲線發聲

虎仔 / 馬日山 2019-05-17 10:53 | 科技新知
當去到語言不通的國家旅遊或瀏覽外語網站,Google 翻譯功能都會大派用場。不過要跟外國人以外語溝通,現時可以讓對方觀看手機屏幕的文字翻譯,或讓電腦合成代為發聲,未來可能會有更人性化的方案,就是 Google 開發中的 Translatotron 項目。

0517-5bFB.jpg

Google 的官方網誌日前透露,正在開發一款 Translatotron,可以用戶自身聲線讀出另一種語言的人工智能,Google 表示 Translatotron 是一款端對端、語音轉語音的翻譯模型。有別於現時 Google 翻譯採用的語音轉文字,再將文字轉語音的翻譯方式,Translatotron 採用神經網絡跳過中間的轉換過程,同時還內置了「講者編碼器」以保存用戶的原有聲線。

Google 指 Translatotron 人工智能有很多好處,例如更快的推理速度、將複合錯誤輸出,而且能更好地處理不需要翻譯的單字,例如專有名詞和名稱等。現在還在開發階段的 Translatotron,Google 表示翻譯質素還未及傳統的方法,但從官方網誌上載的示範聲帶,可以聽到發音比現時的準確和自然。Translatotron 還有一段很長的研發之路要走,但未來我們去外地旅行,可能只需 Translatotron 協助就能跟外國人溝通無阻。

資料來源:gizmodo

 

最新新聞