transformer

本文轉載http://www.javashuo.com/article/p-zzrjxbpb-hh.html 1. 前言 谷歌在2017年發表了一篇論文名字教Attention Is All You Need,提出了一個只基於attention的結構來處理序列模型相關的問題,比如機器翻譯。傳統的神經機器翻譯大都是利用RNN或者CNN來作爲encoder-decoder的模型基礎,而谷歌最新的只基於
相關文章
相關標籤/搜索