聲學模型GMM-HMM訓練

語音識別中聲學模型是重中之重,常用到的聲學模型是GMM-HMM,本文記錄下聲學模型訓練的細節。 下圖是識別某個孤立字的GMM-HMM示意圖。HMM部分是文字所佔的音素以及其轉移概率。語音幀通過已經訓練好的GMM得屬於某個音素的概率,如0.016。 問題是這樣的一個模型怎麼訓練呢? 問題一、一段語音是怎麼切割音素的,如’我‘的拼音是wo,我們按聲韻母分開是:w o?          如果要訓練w和
相關文章
相關標籤/搜索