語音識別第一課:基於Tensorflow的端到端語音識別技術

全文共6655字,預計學習時長13分鐘 本文闡述瞭如何利用Tensorflow編寫一個基本的端到端自動語音識別(Automatic Speech Recognition,ASR)系統,詳細介紹了最小神經網絡的各個組成部分以及可將音頻轉爲可讀文本的前綴束搜索解碼器。 雖然當下關於如何搭建基礎機器學習系統的文獻或資料有很多,但是大部分都是圍繞計算機視覺和自然語言處理展開的,極少有文章就語音識別展開介紹
相關文章
相關標籤/搜索