ICLR2020 NLP優秀論文分享(附源碼)

來源:知乎 https://zhuanlan.zhihu.com/p/139069973 作者:清華阿羅 本文長度爲1500字,建議閱讀5分鐘 爲你分享ICLR2020 NLP優秀論文。 1.REFORMER:THE EFFICIENT TRANSFORMER[1] 論文小結:作者提出了一種新的轉換器模型,對體系架構進行了兩項重大改進:1)使用可逆層以防止需要存儲所有層的激活來進行反向傳播;2)使
相關文章
相關標籤/搜索