谷歌發佈TTS新系統Tacotron 2:直接從文本生成類人語音

近日,谷歌在其官方博客上推出了新的語音合成系統 Tacotron 2,包括一個循環序列到序列特徵預測網絡和一個改良的 WaveNet 模型。Tacotron 2 是在過去研究成果 Tacotron 和 WaveNet 上的進一步提升,可直接從文本中生成類人語音,相較於專業錄音水準的 MOS 值 4.58,Tacotron 2 取得了 4.53 的 MOS 值。雖然結果不錯,但仍有一些問題,比如無法
相關文章
相關標籤/搜索