【信息技術】【2015.03】基於深度神經網絡的語音識別

時間 2020-12-30

原文原文鏈接

本文爲美國斯坦福大學（作者：Andrew Lee Maas）的博士論文，共191頁。隨着計算機設備滲透到日常生活的方方面面，口語是一種越來越普遍的界面選擇方式。自動理解口語是一個巨大的挑戰，因爲它既需要將語音信號轉換成單詞，又需要從單詞本身提取意義。口語理解任務可以大致分爲不同的部分，它們執行（1）音頻信號的低級處理，（2）語音轉錄和（3）自然語言理解。我們描述了改善與口語理解相關的每個子任務的