Tacotron-2：通過調節 WaveNet 對 Mel 頻譜預測的自然 TTS 合成

時間 2021-01-11

原文原文鏈接

根據論文：https://arxiv.org/abs/1712.05884 首先第一部分爲論文主體的翻譯：摘要這篇文章描述了一個直接從文本合成語音的神經網絡架構，Tacotron-2。該系統由兩部分組成，首先是把字符向量（character embeddings）映射到梅爾聲譜（mel-scale spectrograms）的循環序列到序列（seq2seq）結構的特徵預測網絡，之後連接一個改良

>>阅读原文<<