整體結構是 : 狀態組成音素, 音素組成單詞, 單詞構成句子。算法
其中前面把幀識別成狀態(難點),能夠當作gmm作的,也可用用其餘算法模型。第二步,把狀態組合成音素。第三步,把音素組合成單詞。後面都是hmm作的 函數
經過句子,而後分詞,而後分紅每一個音素,在隱馬爾科夫(HMM)模型中通常用3-5個上述的單元表示一個音素。簡單的理解就是咱們每一個音素的均值和方差矩陣知道,經過咱們的句子咱們也知道每一個音素間的轉移機率矩陣。固然,這些是HMM裏的事情。提取特徵後的第一步就完成了,簡單的說就是爲了擬合多維高斯函數。模型
能夠當作gmm作的