淺談seq2seq中的Attention機制

時間 2021-01-09

標籤自然語言處理深度學習简体版

原文原文鏈接

1.Attention機制的提出： Attention模型最早是在計算機視覺領域提出，首次用於解決nlp問題在2014年[1]。由於seq2seq中的原始輸入序列中的單詞對於目標輸出序列的重要性程度是一致的，當輸入序列過長時，此模型的效果將會降低。比如，在機器翻譯方面，對於輸入序列爲「自」，「然」，「語」，「言」，生成的輸出序列爲「Natural」，「Language」。事實上，我們發現，「自」

>>阅读原文<<

相關標籤/搜索

seq2seq+attention+transformer

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。