Tacotron論文閱讀

論文下載 Tacotron是谷歌於2017年提出的端到端語音合成系統,該模型可接收字符的輸入,輸出相應的原始頻譜圖,然後將其提供給 Griffin-Lim 重建算法直接生成語音 ABSTARCT 一個文本轉語音的合成系統通常包含多階段處理,例如文本分析前端,聲學模型和聲音合成模塊。構建這些組件常常需要大量的領域專業知識,而且設計選擇也可能很脆弱。在這篇論文裏,我們提出了Tacotron,一種端到端
相關文章
相關標籤/搜索