【論文筆記】Effective Approaches to Attention-based Neural Machine Translation

時間 2020-12-24

標籤 attention seq2seq NLP 简体版

原文原文鏈接

論文鏈接本文針對NMT任務使用的attention機制提出兩種結構，global attention將attention作用於全部輸入序列，local attention每個時間步將attention作用於輸入序列的不同子集。前者被稱爲soft attention，其原理和論文1一樣，後者是hard attention和soft attention的結合，該文通過context vecto

>>阅读原文<<