Transformer新內核Synthesizer：低複雜度的attention代替點乘式的注意力機制

時間 2020-12-30

標籤論文閱讀筆記简体版

原文原文鏈接

論文鏈接：https://arxiv.org/pdf/2005.00743.pdf 參考文檔：https://mp.weixin.qq.com/s/e2Cor8amz7GiFfBGdLXULg 導讀今天閱讀的是一篇來自Google的最新論文《SYNTHESIZER: Rethinking Self-Attention in Transformer Models》，該論文重新探索了Transfor

>>阅读原文<<