MMI在ASR中的應用

介紹 ASR中DNN聲學模型訓練通常使用CE準則作爲損失函數進行訓練,CE準則是最小化幀錯誤率,但在基於幀識別的ASR中我們一般直接使用WER(自錯誤率)來評價語音識別準確率,更關心的是序列的準確性,會導致損失函數和訓練目標不一致。 DT在識別序列上定義誤差,更接近語音識別的最終目標。 常用DT目標函數有MMI,BMMI,MPE,MBR。 使用CE準則時,又可能幀的正確率提高了但是最終解碼WER沒
相關文章
相關標籤/搜索