阿里巴巴開源語音識別聲學建模技術

時間 2021-01-14

原文原文鏈接

編者按：本文作者阿里巴巴機器智能技術實驗室高級算法工程師張仕良。文章介紹了阿里巴巴的語音識別聲學建模新技術: 前饋序列記憶神經網絡（DFSMN），目前基於DFSMN的語音識別系統已經在法庭庭審識別、智能客服、視頻審覈和實時字幕轉寫、聲紋驗證、物聯網等多個場景成功應用。本次，我們開源了基於Kaldi語音識別工具實現的DFSMN代碼，同時開源了相關訓練腳本。通過開源的代碼和訓練流程，我們在公開的英文

>>阅读原文<<