學習Transformer(The Illustrated Transformer)

複製鏈接 在上一篇文章中(previous post),我們研究了注意力機制 - 一種在現代深度學習模型中無處不在的(ubiquitous)方法。 注意力是一個有助於提高神經機器翻譯(neural machine translation)應用程序性能的概念。 在這篇文章中(In this post),我們將介紹The Transformer–一個使用注意力來提高(boost)這些模型訓練速度的模型
相關文章
相關標籤/搜索