基於HMM的語音識別(二)

今天進入特徵提取部分,原文的2.1部分,進入正題。 特徵提取階段試圖提供語音波形的緊湊形式(這裏我理解不是很好,往下看)。這種形式最大限度的減少單詞間的區分信息的丟失,並且與聲學模型的分佈假設進行良好的匹配。比如,如果對角協方差高斯分佈用於狀態輸出分佈,那麼這些特徵應該被設計爲高斯並且是不相關的。 通常使用約25ms的重疊分析窗每10ms計算一次特徵向量。其中最簡單也是最常用的編碼方式是梅爾倒譜系
相關文章
相關標籤/搜索