Sequence-to-Sequence Speech Recognition with Time-Depth Separable Convolutions

1.論文摘要 提出了一種time-depth separable 的卷積網絡結構,作爲ED模型的encoder,在顯著減少了參數量的同時增加了計算速度,並且可以維持較大的感受野範圍,在noisy LibriSpeech test set 取得了WER 22%的提升。 2.模型結構 encoder TDS 的卷積結構,採用了一個2d卷積,這裏輸入維度爲(batch_size, 1, time_ste
相關文章
相關標籤/搜索