語音識別系列2--基於WFST解碼器

時間 2021-01-12

原文原文鏈接

一、總述解碼器是ASR重要的組件之一，在傳統的基於GMM-HMM/DNN-HMM混合系統中，解碼器架起語言模型、聲學模型、發音詞典等知識源的橋樑，得到最終的識別結果，如圖1所示。隨着深度學習技術的盛行，一系列ASR端到端系統、ASR-NLP端到端系統甚至ASR-NLP-TTS端到端系統被相繼提出，解碼器的作用在被一步步弱化，但是筆者認爲，拋棄解碼器，實現完全的端到端系統還有相當長的路要走。因爲

>>阅读原文<<