DLNLP學習筆記06(Speech Recognition: Neural Transducer模型&MoChA模型&總結)

1 Neural Transducer:根據一個window size將多個輸入進行attention之後,再輸入到decoder。實際實驗結果,加了attention之後window size大小對模型效果影響不大。 2 MoChA (Monotonic Chunkwise Attention):動態地移動window。 3 總結:
相關文章
相關標籤/搜索