Transformer論文詳解,論文完整翻譯(四)

Transformer論文詳解,論文完整翻譯(四) 第三章 模型結構(一) 許多競爭網絡序列轉換模型有encoder-decoder結構。encoder映射是將輸入的符號序列表示(x1,…,xn)轉換成一個序列連續的表示 z。給出z後,decoder生成一個輸出序列(y1,…,yn)每個元素一個符號。每一步,模型都是自動遞歸的,在生成下一個符號時,使用之前生成的符號進行計算。 Transforme
相關文章
相關標籤/搜索