聲學模型GMM-HMM訓練

時間 2021-01-21

原文原文鏈接

語音識別中聲學模型是重中之重，常用到的聲學模型是GMM-HMM，本文記錄下聲學模型訓練的細節。下圖是識別某個孤立字的GMM-HMM示意圖。HMM部分是文字所佔的音素以及其轉移概率。語音幀通過已經訓練好的GMM得屬於某個音素的概率，如0.016。問題是這樣的一個模型怎麼訓練呢？問題一、一段語音是怎麼切割音素的，如’我‘的拼音是wo，我們按聲韻母分開是：w o？如果要訓練w和

>>阅读原文<<