爲了讓機器聽懂「長篇大論」,阿里工程師構建了新模型

小嘰導讀:本研究我們提出了一種改進的前饋序列記憶神經網絡結構,稱之爲深層前饋序列記憶神經網絡(DFSMN)。進一步地我們將深層前饋序列記憶神經網絡和低幀率(LFR)技術相結合構建了LFR-DFSMN語音識別聲學模型。該模型在大詞彙量的英文識別和中文識別任務上都可以取得相比於目前最流行的基於長短時記憶單元的雙向循環神經網絡(BLSTM)的識別系統顯著的性能提升。而且LFR-DFSMN在訓練速度,模型
相關文章
相關標籤/搜索