基於深度學習的語音識別研究-CTC理論推導(四)

  有時候學習真的得循序漸進,並沒有速成的方法,本小白在經歷了大約一個月終於把CTC的從頭到尾大致看完了,下面講一下我的理解,歡迎各位朋友批評指正。   首先,我們得知道爲什麼要引入CTC,前面博客講到,之前在做語音的聲學模型的時候,我們的數據形式是幀與標籤的分別對齊,以Thchs30爲例,訓練集大約25小時的數據集,經過kaldi的GMM-HMM對齊之後,大約分爲917w多幀的語音數據,標籤經過
相關文章
相關標籤/搜索