語音識別系列2--基於WFST解碼器

一、總述 解碼器是ASR重要的組件之一,在傳統的基於GMM-HMM/DNN-HMM混合系統中,解碼器架起語言模型、聲學模型、發音詞典等知識源的橋樑,得到最終的識別結果,如圖1所示。 隨着深度學習技術的盛行,一系列ASR端到端系統、ASR-NLP端到端系統甚至ASR-NLP-TTS端到端系統被相繼提出,解碼器的作用在被一步步弱化,但是筆者認爲,拋棄解碼器,實現完全的端到端系統還有相當長的路要走。因爲
相關文章
相關標籤/搜索