關於Seq2Seq model: Connectionist Temporal classification一些理解（1）

時間 2021-01-12

標籤 ctc seq2seq 語音識別简体版

原文原文鏈接

首先，我們回顧下seq2seq想要解決的問題這樣一類問題：比如說，在語音識別的任務中，我們是輸入一段語音然後輸出一段文字，而在機器翻譯中，假設中英翻譯，那我們就是輸入一段中文的文字序列然後輸出一段英文序列，在這個過程中通常N！=M. 以語音識別任務爲例來詳細展開講述一下CTC：上圖是通常語音識別的預處理過程，首先將常見的音頻文件（mp3，wmv等格式）解壓成wa

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。