深入淺出講解語音合成一:merlin、Gantts及其前端處理

文字轉語音(TTS)是一個給定文字輸入,生成語音波形的系統。本系列文章將從傳統的語音合成方法,到近期的端到端合成方案,各類型的聲碼器(個人認爲比較有潛力的部分)進行講解,作爲近期實習結束後的工作總結。 語音合成過程分爲前端的文本處理,中端的模型訓練和後端的聲碼器合成過程。 在傳統語音合成方法中,前端處理的過程是非常麻煩的。首先,作爲訓練語料的文本需要轉換爲神經網絡能夠識別的數字特徵,所以誕生了HT
相關文章
相關標籤/搜索