開源語音識別系統wav2letter++簡介

語音識別系統是深度學習生態中發展最成熟的領域之一。當前這一代的語音識別模型基本都是基於遞歸神經網絡(Recurrent Neural Network)對聲學和語言模型進行建模,以及用於知識構建的計算密集的特徵提取流水線。雖然基於RNN的技術已經在語音識別任務中得到驗證,但訓練RNN網絡所需要的大量數據和計算能力已經超出了大多數機構的能力範圍。最近,Facebook的AI研究中心(FAIR)發表的一
相關文章
相關標籤/搜索