paper閱讀總結篇（2）：WAVENET: A GENERATIVE MODEL FOR RAW AUDIO

時間 2021-07-10

原文原文鏈接

WaveNet 前言：目前deep learning的目標逐漸開始注重視頻的聲音，然後聲音的frequency是非常高的，paper做法一般採用16khz，一般mp3文件可能更高，大約100多khz左右吧。然後常規的convolution卷積的效果並不理想，因爲感受野太小了，怎麼樣提高感受野是audio模型的關鍵問題，wavenet採用了DILATED CAUSAL CONVOLUTIONS，然

>>阅读原文<<