【論文翻譯】使用少量樣本的神經語音克隆

這篇論文探討了解決語音克隆問題的兩種基本方法:說話人自適應(speaker adaptation)和說話人編碼(speaker encoding)。適用於帶有說話人嵌入的多說話人語音生成模型,不會降低音頻質量。 原論文鏈接: Neural Voice Cloning with a Few Samples 摘要   語音克隆是個性化語音接口的一項備受期待的能力。基於神經網絡的語音合成已經顯示能爲大量
相關文章
相關標籤/搜索