百度語音合成模型Deep Voice3

時間 2021-07-14

標籤深度學習简体版

原文原文鏈接

INTRODUCTION Deep Voice3是由百度提出的一個全新的全卷積TTS架構。百度的主要工作分爲如下五個方面：提出了一個全卷積的 character-to-spectrogram 架構，它能並行計算，並且比使用循環單元的架構快 Deep Voice3訓練非常快，並且可以擴展到LibriSpeech語音數據集，該數據集包含來自2484個說話人的820小時音頻數據可以產生單調的注意力行

>>阅读原文<<