【深度學習】Transformer

Transformer的Encoder部分(不是上圖一個一個的標爲encoder的模塊,而是紅框內的整體,上圖來自The Illustrated Transformer,Jay Alammar把每個Block稱爲Encoder不太符合常規叫法)是由若干個相同的Transformer Block堆疊成的。 這個Transformer Block其實才是Transformer最關鍵的地方,核心配方就在
相關文章
相關標籤/搜索