簡單的語音分類任務入門(需要些深度學習基礎)

引言 上次公衆號剛剛講過使用 python 播放音頻與錄音的方法,接下來我將介紹一下簡單的語音分類處理流程。簡單主要是指,第一:數據量比較小,主要是考慮到數據量大,花費的時間太長。作爲演示,我只選取了六個單詞作爲分類目標,大約 350M 的音頻。實際上,整個數據集包含 30 個單詞的分類目標,大約 2GB 的音頻。第二 :使用的神經網絡比較簡單,主要是因爲分類目標只有 6 個。如果讀者有興趣的話,
相關文章
相關標籤/搜索