Attention Is All Your Need 中文版

Attention Is All Your Need 摘要   主流的序列轉換模型都是基於複雜的循環神經網絡或卷積神經網絡,且都包含一個encoder和一個decoder。表現最好的模型還通過attention機制把encoder和decoder聯接起來。我們提出了一個新的、簡單的網絡架構,Transformer. 它只基於單獨的attention機制,完全避免使用循環和卷積。在兩個翻譯任務上表明
相關文章
相關標籤/搜索