深度學習：transformer模型

時間 2020-02-14

標籤深度學習 transformer 模型简体版

原文原文鏈接

Google於2017年6月發佈在arxiv上的一篇文章《Attention is all you need》，提出解決sequence to sequence問題的transformer模型，用全attention的結構代替了lstm，拋棄了以前傳統的encoder-decoder模型必須結合cnn或者rnn的固有模式，只用attention，可謂大道至簡。文章的主要目的是在減小

>>阅读原文<<