【論文翻譯】Tacotron:端到端語音合成

Tacotron是谷歌於2017年提出的端到端語音合成系統,該模型可接收字符的輸入,輸出相應的原始頻譜圖, 然後將其提供給 Griffin-Lim 重建算法直接生成語音。 原論文鏈接: Tacotron: Towards End-to-End Speech Synthesis 最近開始研究端到端語音合成。相關的論文原本準備自己翻譯,看到網上已經有翻譯的比較好的版本, 故轉載於此,僅作重新排版和細節
相關文章
相關標籤/搜索