斯坦福CS224n NLP課程【十二】——語音處理的端對端模型

Automatic Speech Recognition ASR ASR就是將聲學信號轉化爲文本的系統  語音是一種自然的用戶接口: 傳統ASR:傳統做法的主體是生成式語言模型,建模聲學信號與文本的發音特徵的聯合概率,但pipeline的不同部分摻雜了不同的機器學習模型   現代ASR:神經網絡興起之後,人們發現傳統pipeline中的每個模型都可以被一種對應的神經網絡所替代,並且取得更好的效果:
相關文章
相關標籤/搜索