基於Tensorflow的VCTK語音識別例子測試

時間 2020-12-27

原文原文鏈接

語音識別是深度學習早先攻克的幾個領域之一。傳統的基於HMM等的語音識別精度一直比較受限。但是深度學習還是給語音識別的精度帶來了一個飛躍性的提高。本文在網上找了段代碼實現了下，感覺非常簡單就可以復現。不過看了過程，也非常簡單，主要有幾步：（1）　下載VCTK數據集；（2）　對數據集，提取每個WAV文件的MFCC特徵以及對應的語音文本標註語料。（3）　設置CTC的損失目標函數。（4）　進行訓