基於Matconvnet深度學習框架的方言分類(1)

背景 本文是基於Matconvnet深度學習框架對方言音頻文件進行分類,介紹如下: 預處理數據 聲譜圖 預處理數據都是對音頻文件進行處理,我們都知道 CNN 主要是針對二維數據做分類等,因此我們第一步需要做的是將一維的音頻信號,通過調用specgram函數將音頻文件轉換成聲譜圖,我在實驗中的採用過兩種參數,分別如下: [b,f,t] = specgram(x,512,fs,512,256); [b
相關文章
相關標籤/搜索