Transformer模型--Attention機制

時間 2020-12-23

標籤 Transformer模型 Attention機制简体版

原文原文鏈接

Transformer模型來源於谷歌2017年的一篇文章（Attention is all you need）。在現有的Encoder-Decoder框架中，都是基於CNN或者RNN來實現的。而Transformer模型匯中拋棄了CNN和RNN，只使用了Attention來實現。因此Transformer是一個完全基於注意力機制的Encoder-Decoder模型。在Transformer模型中

>>阅读原文<<