深入淺出講解語音合成二:tacotron2及其改進方向

傳統的語音合成方案如Merlin、HTS等,依賴於fulllabel和匹配問題集的生成,導致前端的處理工作是非常繁瑣的。近年來,爲了減少前端的數據準備工作,誕生了tacotron等優秀的端到端語音合成方案。本文着重講解一下在業界廣受好評的tacotron2,其結合了seq2seq(序列到序列)、位置敏感注意力機制及其端到端的語音合成方法,非常值得學習。 1.序列到序列 序列到序列最早應用於機器翻譯
相關文章
相關標籤/搜索