FBank與MFCC

預處理 分幀 我們需要將不定長的音頻切分成固定長度的小段,這一步稱爲分幀。一般取10-30ms爲一幀,爲了避免窗邊界對信號的遺漏,因此對幀做偏移時候,要有幀迭(幀與幀之間需要重疊一部分)。 一般取幀長的一半作爲幀移,也就是每次位移一幀的二分之一後再取下一幀,這樣可以避免幀與幀之間的特性變化太大。通常的選擇是25ms每幀,幀迭爲10ms。接下來的操作是對單幀進行的。 要分幀是因爲語音信號是快速變化的
相關文章
相關標籤/搜索