Tacotron-2:通過調節 WaveNet 對 Mel 頻譜預測的自然 TTS 合成

根據論文:https://arxiv.org/abs/1712.05884 首先第一部分爲論文主體的翻譯: 摘要 這篇文章描述了一個直接從文本合成語音的神經網絡架構,Tacotron-2。該系統由兩部分組成,首先是把字符向量(character embeddings)映射到梅爾聲譜(mel-scale spectrograms)的循環序列到序列(seq2seq)結構的特徵預測網絡,之後連接一個改良
相關文章
相關標籤/搜索