interspeech2020論文閱讀

interspeech2020論文閱讀 Streaming ASR 1.Scout Network (1)SN 文中用SN檢測word boundary(嚴格來說是label boundary),模型採用N個self-attention層(最前面有CNN層做下采樣),因爲第i幀特徵對應的輸出僅依賴於前面的輸出(如何實現的,通過mask??),所以SN沒有latency。SN輸出層用一個linear
相關文章
相關標籤/搜索