目前天然語音合成(TTS)進度一點看法

目前實驗模型wavenet,parallel wavenet, tacotron, deep voice 3, clarinet學習 1. 須要preemphasis來產生更好的音頻google 來自社區國人tacotron2的commitcode 2. 轉換到mu-law域能夠stabilize訓練過程,加速converge, 可是好像對最優解生成的音頻質量沒什麼影響,因此如今訓練仍是rawbl
相關文章
相關標籤/搜索