paper閱讀總結篇(2):WAVENET: A GENERATIVE MODEL FOR RAW AUDIO

WaveNet 前言: 目前deep learning的目標逐漸開始注重視頻的聲音,然後聲音的frequency是非常高的,paper做法一般採用16khz,一般mp3文件可能更高,大約100多khz左右吧。然後常規的convolution卷積的效果並不理想,因爲感受野太小了,怎麼樣提高感受野是audio模型的關鍵問題,wavenet採用了DILATED CAUSAL CONVOLUTIONS,然
相關文章
相關標籤/搜索