Google新作synthesizer：Rethinking Self-Attention in Transformer Models

時間 2021-01-06

原文原文鏈接

0. 背景機構：Google Research 作者：Yi Tay, Dara Bahri, Donald Metzler, Da-Cheng Juan, Zhe Zhao, Che Zheng 論文地址：https://arxiv.org/abs/2005.00743 0.1 摘要以當下基於Transformer的各種先進模型來看，使用點積自注意力（dot product self-atte

>>阅读原文<<