極限元語音算法專家劉斌:基於深度學習的語音生成問題

一、深度學習在語音合成中的應用 語音合成主要採用波形拼接合成和統計參數合成兩種方式。波形拼接語音合成需要有足夠的高質量發音人錄音才能夠合成高質量的語音,它在工業界中得到了廣泛使用。統計參數語音合成雖然整體合成質量略低,但是在發音人語料規模有限的條件下,優勢更爲明顯。在上一期我們重點介紹了深度學習在統計參數語音合成中的應用,本期將和大家分享基於波形拼接的語音合成系統,圍繞 Siri 近期推出的語音合
相關文章
相關標籤/搜索