語言模型

語音增強和語音識別系列博文 電話有效語音範圍125Hz ∼ ∼ 3800Hz。使用HMM做爲語音識別系統的前提是連續語音特徵可以分成準靜態序列。這些狀態序列之間是不相關的,系統通常採用25ms的幀長,10ms的滑動長度,提取特徵MFCC/PLP做分析特徵。 上面的假設的HMM狀態的獨立性在語音上實際上並不成立,這是由於觀察到的每一幀語音都或多或少依賴前面的語音(發音器官的生物物理特性)。所以希望將
相關文章
相關標籤/搜索