論文筆記:Connectionist Temporal Classification: Labelling Unsegmented Sequence

感想 這篇文章不是好懂,需要有機器學習基礎,特別是要了解HMM的前向後向算法,如果有人不知道這個算法的思想,可以參考周志華《機器學習》一書,上面對這個算法有一個詳細的講解,這篇文章最大的貢獻就是提出了CTC的loss function,把神經網絡輸出後,把輸出和語音文稿的映射變成了一個解碼,我們只需要找到一條最佳路徑,從而得到這段語音的轉錄文本,但是尋找所有路徑求概率和是不可能了,因此有了前綴搜索
相關文章
相關標籤/搜索