Transformer詳解

文章目錄 12. Transformer 12.1 Introduction 12.2 在 Seq2Seq 架構中計算 Attention 12.2.1 計算 Key k : i k_{:i} k:i​ 和 Query q : j q_{:j} q:j​ 12.2.2 計算 α : j \alpha_{:j} α:j​ 12.2.3 計算 Value v : i v_{:i} v:i​ 12.2.
相關文章
相關標籤/搜索