CTC模型簡介

CTC(Connectionist temporal classification),可以理解爲基於神經網絡的時序類分類。 比如語音識別的一幀數據,很難給出一個label,但是幾十幀數據就容易判斷出對應的發音label。 語音識別聲學模型的訓練屬於監督學習,需要知道每一幀對應的label才能進行有效的訓練,在訓練的數據準備階段必須要對語音進行強制對齊。  CTC的引入可以放寬了這種一一對應的限制要
相關文章
相關標籤/搜索