JavaShuo
欄目
標籤
ICLR 2020 | reformer高效處理長序列,單機能跑,計算資源貧困人士的福音
時間 2021-01-10
標籤
熱點
專題
深度學習
自然語言處理
機器學習
简体版
原文
原文鏈接
基於Transformer的各種巨型模型在各種自然語言處理任務中常常能夠取得最優結果,但這些模型的訓練成本往往過高,在針對長序列文本上尤甚。爲此,本文提出兩種技術以改善基於Transformer的這類模型,名爲Reformer。第一,使用局部敏感hash,替換原始的點乘方式的attention,從而將其空間複雜度從O(L^2)降低到O(Llog L),其中L表示文本序列的長度。第二,使用逆殘差層代
>>阅读原文<<
相關文章
1.
Reformer: 高效的Transformer
2.
Reformer:高效的Transformer
3.
ICLR 2020|ELECTRA
4.
圖解Reformer:一種高效的Transformer
5.
《高效能人士的七個習慣》
6.
高效能人士的七個習慣
7.
【高效能人士的七個習慣】
8.
Funnel-Transformer:讓Transformer更高效地處理長序列
9.
項目管理——如何才能成爲高效能人士
10.
《高效能人士的 7 個習慣》知識整理
更多相關文章...
•
Docker 資源彙總
-
Docker教程
•
錯誤處理
-
RUST 教程
•
漫談MySQL的鎖機制
•
算法總結-歸併排序
相關標籤/搜索
貧困
iclr
計算機圖像處理
IM的福音
高效能人士的七個習慣
高效能人士的 7 個習慣
語音處理
高效能
計算機原理
長跑
Hibernate教程
網站主機教程
PHP 7 新特性
計算
靜態資源
算法
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
css 讓chrome支持小於12px的文字
2.
集合的一點小總結
3.
ejb
4.
Selenium WebDriver API
5.
人工智能基礎,我的看法
6.
Non-local Neural及Self-attention
7.
Hbuilder 打開iOS真機調試操作
8.
improved open set domain adaptation with backpropagation 學習筆記
9.
Chrome插件 GitHub-Chart Commits3D直方圖視圖
10.
CISCO ASAv 9.15 - 體驗思科上一代防火牆
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
Reformer: 高效的Transformer
2.
Reformer:高效的Transformer
3.
ICLR 2020|ELECTRA
4.
圖解Reformer:一種高效的Transformer
5.
《高效能人士的七個習慣》
6.
高效能人士的七個習慣
7.
【高效能人士的七個習慣】
8.
Funnel-Transformer:讓Transformer更高效地處理長序列
9.
項目管理——如何才能成爲高效能人士
10.
《高效能人士的 7 個習慣》知識整理
>>更多相關文章<<