Attention is All You Need 論文筆記

文章目錄 概述 背景 模型架構 概述 主流的序列轉換模型(dominant sequence transduction models)都是基於複雜的遞歸神經網絡或者卷積神經網絡,包括一個編碼器(encoder)和一個解碼器(decoder) 表現最好的模型是利用注意力機制將編碼器和解碼器連接起來 我們提出了一個簡單的網絡架構Transformer,簡單地基於注意力機制,並且不用遞歸和卷積操作 在實
相關文章
相關標籤/搜索