從零開始語音識別(5)--- 端到端的語音識別系統

爲什麼需要端到端的系統 傳統語音識別系統非常複雜,需要分別訓練聲學模型、語言模型、發音模型 需要領域特殊的專業知識 通過端到端的模型可以直接將輸入的聲學特徵轉變爲文本 端到端語音識別系統介紹 Seq2Seq 此模型長用於機器翻譯、語音識別。其優點是輸入輸出不需要等長,而且兩者長度不固定。 此模型包含兩個RNN結構,分別用於編碼與解碼。Decoder網絡直到解碼的序列是END才停止,因此可以實現變長
相關文章
相關標籤/搜索