關於Seq2Seq model: Connectionist Temporal classification一些理解(1)

    首先,我們回顧下seq2seq想要解決的問題這樣一類問題:     比如說,在語音識別的任務中,我們是輸入一段語音然後輸出一段文字,而在機器翻譯中,假設中英翻譯,那我們就是輸入一段中文的文字序列然後輸出一段英文序列,在這個過程中通常N!=M.     以語音識別任務爲例來詳細展開講述一下CTC:     上圖是通常語音識別的預處理過程,首先將常見的音頻文件(mp3,wmv等格式)解壓成wa
相關文章
相關標籤/搜索