《Longformer: The Long-Document Transformer》（）論文閱讀

時間 2021-01-10

標籤論文筆記简体版

原文原文鏈接

前言論文地址：https://arxiv.org/pdf/2004.05150.pdf 代碼地址：https://github.com/allenai/longformer 1、Introduction 雖然 self-attention 的效果很好，但是它所需要的內存和算力會隨序列呈平方增長。現在的方法大多是將上下文縮短或者劃分爲較小的序列，以限制這些序列再512的長度內。爲了解決這個問題，

>>阅读原文<<

1. Longformer解讀: The Long-Document Transformer
2. 論文閱讀：Spatial Transformer Networks
3. 論文閱讀：Spatial Transformer Network
4. 博客閱讀：圖解Transformer（The Illustrated Transformer）
5. ICLR2020論文閱讀筆記reformer: THE EFFICIENT TRANSFORMER
6. Spatial Transformer Networks--論文閱讀筆記
7. Feature Pyramid Transformer論文閱讀翻譯 -- 2020ECCV
8. ReFormer論文解讀（THE EFFICIENT TRANSFORMER）
9. 【論文閱讀】Triple GANs論文閱讀
10. 論文閱讀
更多相關文章...
• RSS 閱讀器 - RSS 教程
• C# 文本文件的讀寫 - C#教程
• JDK13 GA發佈：5大特性解讀
• Scala 中文亂碼解決

相關標籤/搜索

最新文章

1. FM理論與實踐
2. Google開發者大會，你想知道的都在這裏
3. IRIG-B碼對時理解
4. 乾貨：嵌入式系統設計開發大全！（萬字總結）
5. 從域名到網站—虛機篇
6. php學習5
7. 關於ANR線程阻塞那些坑
8. android studio databinding和include使用控件id獲取報錯不影響項目正常運行
9. 我女朋友都會的安卓逆向（四動態調試smali）
10. io存取速度

本站公眾號

歡迎關注本站公眾號,獲取更多信息

1. Longformer解讀: The Long-Document Transformer
2. 論文閱讀：Spatial Transformer Networks
3. 論文閱讀：Spatial Transformer Network
4. 博客閱讀：圖解Transformer（The Illustrated Transformer）
5. ICLR2020論文閱讀筆記reformer: THE EFFICIENT TRANSFORMER
6. Spatial Transformer Networks--論文閱讀筆記
7. Feature Pyramid Transformer論文閱讀翻譯 -- 2020ECCV
8. ReFormer論文解讀（THE EFFICIENT TRANSFORMER）
9. 【論文閱讀】Triple GANs論文閱讀
10. 論文閱讀

>>更多相關文章<<