全序列卷積神經網絡+連接時序分類語音識別

時間 2021-01-06

原文原文鏈接

全序列卷積神經網絡 DFCNN：deep fully convolutional neural network 全序列卷積神經網絡 DFCNN對時域信號進行分幀、加窗、傅里葉變換、取對數得到語譜圖。語譜圖的x是時間，y軸是頻率，z軸是幅度。幅度用亮色如紅色表示高，用深色表示低。利用語譜圖可以查看指定頻率端的能量分佈。 DFCNN直接將一句語音作爲輸入，輸出單元則直接與最終的識別結果相對應（音節或

>>阅读原文<<