DFSMN在阿里巴巴的應用以及如何採用開源代碼訓練DFSMN模型

本文做者:鐳銘,譫良 DFSMN模型是語音識別中一種先進的聲學模型,語音識別中的聲學模型是語音識別技術中的核心所在。具體來講,聲學模型是根據輸入語音進行發音可能性的識別,結合語言模型、解碼器,就構成了完整的語音識別系統。本次開源的DFSMN模型,是阿里巴巴的高效工業級實現,相對於傳統的LSTM、BLSTM等聲學模型,該模型具有訓練速度更快、識別更高效、識別準確率更高和模型大小壓縮等效果。html
相關文章
相關標籤/搜索