語音特徵提取技術——MFCC

語音識別和說話人識別中,常用的語音特徵是基於Mel頻率的倒譜系數(即MFCC)。MFCC參數是將人耳的聽覺感知特性和語音的產生機制相結合。 人的發聲由很多部位共同影響的結果,如嘴形、牙齒等因素,這種形狀可以決定聲音的輸出。如果我們可以精確的確定形狀,那麼我們就可以對發出的因素進行科學的表示。 MFCC倒譜系數計算過程如下; ① 將信號進行分幀,預加重和加漢明窗處理,然後進行短時傅里葉變換並得到其頻
相關文章
相關標籤/搜索