Sequence discriminative training

       語音識別聲學模型DNN訓練通常用cross-entropy(CE)作爲損失函數進行訓練,CE可以看做是KL散度的一種形式 ,用來評價期望分佈和當前訓練模型概率分佈的差距。方便計算,所以常常被用來作爲損失函數廣泛使用。然而基於幀識別的語音識別中,往往用WER或者CER,PER來作爲評價語音識別的準確率。損失函數和訓練目標不一致,因此[1]提出了基於序列區分度(Sequence Disc
相關文章
相關標籤/搜索