對Attention is all you need 的理解

本文參考的原始論文地址:https://arxiv.org/abs/1706.03762 谷歌昨天在arxiv發了一篇論文名字教Attention Is All You Need,提出了一個只基於attention的結構來處理序列模型相關的問題,比如機器翻譯。傳統的神經機器翻譯大都是利用RNN或者CNN來作爲encoder-decoder的模型基礎,而谷歌最新的只基於Attention的Trans
相關文章
相關標籤/搜索