阿里巴巴開源語音識別聲學建模技術

編者按:本文作者阿里巴巴機器智能技術實驗室高級算法工程師張仕良。文章介紹了阿里巴巴的語音識別聲學建模新技術: 前饋序列記憶神經網絡(DFSMN),目前基於DFSMN的語音識別系統已經在法庭庭審識別、智能客服、視頻審覈和實時字幕轉寫、聲紋驗證、物聯網等多個場景成功應用。本次,我們開源了基於Kaldi語音識別工具實現的DFSMN代碼,同時開源了相關訓練腳本。 通過開源的代碼和訓練流程,我們在公開的英文
相關文章
相關標籤/搜索