語音識別中的End2End模型: CTC, RNN-T與LAS

自動語音識別(Automatic Speech Recognition,簡稱ASR)是一項將機器學習與實際需要緊密結合的領域,應用場景如語音助手,聊天機器人,客服等等。今天就來比較一下比較流行的幾種End-to-End的ASR模型。 經典語音識別系統 在瞭解End-to-End模型之前,我們先來看看經典的語音識別系統是怎樣工作的以及爲什麼需要End-to-End模型。 經典語音識別系統通常有如下幾
相關文章
相關標籤/搜索