Sequence-to-Sequence Speech Recognition with Time-Depth Separable Convolutions

時間 2021-01-18

標籤語音識別asr 深度學習简体版

原文原文鏈接

1.論文摘要提出了一種time-depth separable 的卷積網絡結構，作爲ED模型的encoder,在顯著減少了參數量的同時增加了計算速度，並且可以維持較大的感受野範圍，在noisy LibriSpeech test set 取得了WER 22%的提升。 2.模型結構 encoder TDS 的卷積結構，採用了一個2d卷積，這裏輸入維度爲（batch_size, 1, time_ste

>>阅读原文<<