深度學習----NLP-transformer模型詳解

時間 2020-12-30

標籤 trainsformer 简体版

原文原文鏈接

Google於2017年6月發佈在arxiv上的一篇文章《Attention is all you need》，提出解決sequence to sequence問題的transformer模型，用全attention的結構代替了lstm，拋棄了之前傳統的encoder-decoder模型必須結合cnn或者rnn的固有模式，只用attention，可謂大道至簡。文章的主要目的是在減少

>>阅读原文<<