attention is all you need(Transformer)

attention is all you need 來源 研究動機 模型結構 Transformer 好處 code 來源 2017 NIPS Transformer 模型 谷歌 研究動機 RNN 是一個廣泛使用的神經網絡模型用來處理序列數據,但是RNN模型存在訓練數據慢、對於長距離依賴關係學習能力不足的缺陷,針對這些特點,本文提出Transformer模型,完全依賴於self-attention
相關文章
相關標籤/搜索