關於Transformer的若干問題整理記錄& 思考

模型總覽: 1.Transformer的結構是什麼樣的? Transformer本身還是一個典型的encoder-decoder模型,如果從模型層面來看,Transformer實際上就像一個seq2seq with attention的模型,下面大概說明一下Transformer的結構以及各個模塊的組成。 (1). Encoder端 & Decoder端總覽 Encoder端由N(原論文中N=6)
相關文章
相關標籤/搜索