阿里巴巴語音識別模型 DFSMN 的使用指南


阿里巴巴 2018 年開源的語音識別模型 DFSMN,將全球語音識別準確率紀錄提升至 96.04%。DFSMN 模型,是阿里巴巴的高效工業級實現,相對於傳統的 LSTM、BLSTM 等聲學模型,該模型具有訓練速度更快、識別更高效、識別準確率更高和模型大小壓縮等效果。git

本場 Chat 的主要內容包括:算法

    1. 語音識別流程簡介;
    2. Kaldi 的部署使用;
    3. 如何訓練基於中文的 DFSMN 聲學模型;
    4. 語音特徵提取 MFCC 算法源碼解讀;
    5. 語音識別工具對比。


https://gitbook.cn/gitchat/activity/5bcc8f9b0920511ab0ff412b工具

相關文章
相關標籤/搜索