全序列卷積神經網絡+連接時序分類語音識別

全序列卷積神經網絡 DFCNN:deep fully convolutional neural network 全序列卷積神經網絡 DFCNN對時域信號進行分幀、加窗、傅里葉變換、取對數得到語譜圖。 語譜圖的x是時間,y軸是頻率,z軸是幅度。幅度用亮色如紅色表示高,用深色表示低。利用語譜圖可以查看指定頻率端的能量分佈。 DFCNN直接將一句語音作爲輸入,輸出單元則直接與最終的識別結果相對應(音節或
相關文章
相關標籤/搜索