百度語音合成模型Deep Voice3

INTRODUCTION Deep Voice3是由百度提出的一個全新的全卷積TTS架構。百度的主要工作分爲如下五個方面: 提出了一個全卷積的 character-to-spectrogram 架構,它能並行計算,並且比使用循環單元的架構快 Deep Voice3訓練非常快,並且可以擴展到LibriSpeech語音數據集,該數據集包含來自2484個說話人的820小時音頻數據 可以產生單調的注意力行
相關文章
相關標籤/搜索