transformer模型原理

原文鏈接:http://jalammar.github.io/illustrated-transformer/   高級外觀 讓我們首先將模型看作一個黑盒子。在機器翻譯應用程序中,它將使用一種語言的句子,並將其翻譯輸出到另一種語言中。 彈出Optimus Prime的優點,我們看到了編碼組件,解碼組件以及它們之間的連接。 編碼組件是一堆編碼器(紙張堆疊其中六個相互疊加 - 沒有什麼神奇的六號,一個
相關文章
相關標籤/搜索