語音識別-信號處理篇

語音增強系列博文 連接前端和後端的語音識別(ASR)的關鍵是給到後端(根據特徵判定詞/句)系統的特徵類型和特徵質量,對於傳統的語音識別系統常採用MFCC(mel-frequency ceptral coefficients),這個特徵對於高斯白噪聲和混響具有魯棒性,對於有色和相干干擾,常採用一階和二階微分減小其對MFCC係數的影響,該方法計算量相對較小;對於深度學習,通常採用Fbank做爲特徵而非
相關文章
相關標籤/搜索