【信息技術】【2015.03】基於深度神經網絡的語音識別

本文爲美國斯坦福大學(作者:Andrew Lee Maas)的博士論文,共191頁。 隨着計算機設備滲透到日常生活的方方面面,口語是一種越來越普遍的界面選擇方式。自動理解口語是一個巨大的挑戰,因爲它既需要將語音信號轉換成單詞,又需要從單詞本身提取意義。口語理解任務可以大致分爲不同的部分,它們執行(1)音頻信號的低級處理,(2)語音轉錄和(3)自然語言理解。我們描述了改善與口語理解相關的每個子任務的
相關文章
相關標籤/搜索