HTK語音信號處理-幀序列

本文假設所處理的語音輸入格式是WAVEFORM(SOURCEKIND的值設置),由HTK庫中HWave庫提供處理支持,對於其它的格式,基本也是相通的。從原始語音到最後的特徵向量(如MFCC)文件需要經過 原始語音->預加重->分幀->加窗處理->快速傅里葉轉換->濾波組處理->離散餘弦轉換(計算倒譜參數)->對數能量->差量倒譜參數(向量的形式了)->MFCC特徵 本文只完成對預加重、分幀及加窗處
相關文章
相關標籤/搜索