Google 開發 AI 翻譯系統 可模擬用戶聲線發聲
|
科技新知
Google 的官方網誌日前透露,正在開發一款 Translatotron,可以用戶自身聲線讀出另一種語言的人工智能,Google 表示 Translatotron 是一款端對端、語音轉語音的翻譯模型。有別於現時 Google 翻譯採用的語音轉文字,再將文字轉語音的翻譯方式,Translatotron 採用神經網絡跳過中間的轉換過程,同時還內置了「講者編碼器」以保存用戶的原有聲線。
Google 指 Translatotron 人工智能有很多好處,例如更快的推理速度、將複合錯誤輸出,而且能更好地處理不需要翻譯的單字,例如專有名詞和名稱等。現在還在開發階段的 Translatotron,Google 表示翻譯質素還未及傳統的方法,但從官方網誌上載的示範聲帶,可以聽到發音比現時的準確和自然。Translatotron 還有一段很長的研發之路要走,但未來我們去外地旅行,可能只需 Translatotron 協助就能跟外國人溝通無阻。
資料來源:gizmodo