基於Tensorflow的VCTK語音識別例子測試

語音識別是深度學習早先攻克的幾個領域之一。傳統的基於HMM等的語音識別精度一直比較受限。但是深度學習還是給語音識別的精度帶來了一個飛躍性的提高。本文在網上找了段代碼實現了下,感覺非常簡單就可以復現。 不過看了過程,也非常簡單,主要有幾步: (1) 下載VCTK數據集; (2) 對數據集,提取每個WAV文件的MFCC特徵以及對應的語音文本標註語料。 (3) 設置CTC的損失目標函數。 (4) 進行訓
相關文章
相關標籤/搜索