WAVENET論文閱讀

論文下載 谷歌DeepMind2016年的深度生成模型 WaveNet 將機器語音合成的表現與人類之間水平的差距至少縮減了 50% ABSTRACT 這篇論文提出了WaveNet,一個生成原始音頻波形的深度神經網絡。這是一個完全的概率自迴歸模型,它基於之前已經生成的所有樣本,來預測當前音頻樣本的概率分佈;不過,我們將會展示它可以在每秒數萬採樣率的音頻數據上高效地進行訓練。將其應用到語音合成,它獲得
相關文章
相關標籤/搜索