Attention Is All You Need

參考論文:Attention is all you need網絡 這篇論文超火的, 樓樓也過來湊個熱鬧。架構 背景: 主流的Seq-Seq的模型一般採用RNN或者是CNN,通常在網絡結構中都會用到encoder和decoder, 效果比較好的模型會經過attention(注意力機制)鏈接encoder和decoder。可是這種網絡結構也存在一些問題:框架 1. RNN 網絡結構:函數   遞歸框架
相關文章
相關標籤/搜索