transformer模型核心圖解

三圖解萬言!!! 模型圖: 動畫: 首先輸入源語:「I arrived at the 」 第一層 self-attention 然後第二層 self-attention,輸入是上一層attention的結果 然後第三層 self-attention,輸入是上一層的attention結果。 這樣 見過三次多頭attention後,得到輸入句子的句法樹。 完了Decoder是< start> 開始,拿
相關文章
相關標籤/搜索