語音識別聲學模型介紹

時間 2021-01-08

標籤人工智能简体版

原文原文鏈接

關於聲學模型，主要有兩個問題，分別是特徵向量序列的可變長和音頻信號的豐富變化性。可變長特徵向量序列問題在學術上通常有動態時間規劃（Dynamic Time Warping, DTW）和隱馬爾科夫模型（Hidden Markov Model, HMM）方法來解決。而音頻信號的豐富變化性是由說話人的各種複雜特性或者說話風格與語速、環境噪聲、信道干擾、方言差異等因素引起的。聲學模型需要足夠的魯棒性來處理

>>阅读原文<<