基於Matconvnet深度學習框架的方言分類（1）

時間 2020-12-20

原文原文鏈接

背景本文是基於Matconvnet深度學習框架對方言音頻文件進行分類，介紹如下：預處理數據聲譜圖預處理數據都是對音頻文件進行處理，我們都知道 CNN 主要是針對二維數據做分類等，因此我們第一步需要做的是將一維的音頻信號，通過調用specgram函數將音頻文件轉換成聲譜圖，我在實驗中的採用過兩種參數，分別如下： [b,f,t] = specgram(x,512,fs,512,256); [b

>>阅读原文<<