從零開始語音識別（5）--- 端到端的語音識別系統

時間 2021-01-05

原文原文鏈接

爲什麼需要端到端的系統傳統語音識別系統非常複雜，需要分別訓練聲學模型、語言模型、發音模型需要領域特殊的專業知識通過端到端的模型可以直接將輸入的聲學特徵轉變爲文本端到端語音識別系統介紹 Seq2Seq 此模型長用於機器翻譯、語音識別。其優點是輸入輸出不需要等長，而且兩者長度不固定。此模型包含兩個RNN結構，分別用於編碼與解碼。Decoder網絡直到解碼的序列是END才停止，因此可以實現變長

>>阅读原文<<