【計算機科學】【2014】用於自動語音識別ASR的深度神經網絡聲學模型

本文爲加拿大多倫多大學(作者:Abdel-rahman Mohamed)的博士論文,共129頁。 自動語音識別(ASR)是信息時代的一項關鍵核心技術。ASR系統已經從孤立數字的區分發展到識別電話質量、自然語音,在各個領域有着越來越多的實際應用。儘管如此,語音識別仍然面臨着嚴峻的挑戰,需要在語音識別過程的幾乎每個階段進行重大改進。多年來,ASR的標準方法基本保持不變,它使用隱馬爾可夫模型(HMM)對
相關文章
相關標籤/搜索