簡單的語音分類任務入門（需要些深度學習基礎）

時間 2021-01-13

原文原文鏈接

引言上次公衆號剛剛講過使用 python 播放音頻與錄音的方法，接下來我將介紹一下簡單的語音分類處理流程。簡單主要是指，第一：數據量比較小，主要是考慮到數據量大，花費的時間太長。作爲演示，我只選取了六個單詞作爲分類目標，大約 350M 的音頻。實際上，整個數據集包含 30 個單詞的分類目標，大約 2GB 的音頻。第二：使用的神經網絡比較簡單，主要是因爲分類目標只有 6 個。如果讀者有興趣的話，

>>阅读原文<<