JavaShuo
欄目
標籤
transformer---李宏毅
時間 2020-12-24
標籤
Artificial Neural Networks
简体版
原文
原文鏈接
什麼是transformer?對於seq2seq模型,我們常用的是RNN,但我們所使用的RNN是按照時間步去計算的,缺少並行性,當我們的訓練集很龐大時,我們的訓練時間要很久,而李宏毅老師在視頻裏講到,有人提出用CNN去替代RNN,如下圖,左圖爲雙向RNN,而右圖爲CNN去訓練序列 我們看到右圖中使用CNN對序列進行特徵的提取,圖中每一個三角形代表一個filter,我們第一層提取相鄰的序列單詞的特徵
>>阅读原文<<
相關文章
1.
李宏毅——transformer
2.
2.Spatial Transformer Layer(李宏毅)
3.
李宏毅學習筆記15.Transformer
4.
李宏毅《Deep Learning》學習筆記 - transformer
5.
Transformer|深度學習(李宏毅)(八)
6.
李宏毅:spatial transformer (空間變換)
7.
【李宏毅】RNN
8.
李宏毅__ML_Notes_4.21
9.
李宏毅__ML_Notes_5.11
10.
【李宏毅】CNN
更多相關文章...
•
R 數據框
-
R 語言教程
•
錯誤處理
-
RUST 教程
•
RxJava操作符(十)自定義操作符
•
☆基於Java Instrument的Agent實現
相關標籤/搜索
李宏毅
transformer
李彥宏
李宏毅機器學習(2017)
方毅
毅然
毅力
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
部署Hadoop(3.3.0)僞分佈式集羣
2.
從0開始搭建hadoop僞分佈式集羣(三:Zookeeper)
3.
centos7 vmware 搭建集羣
4.
jsp的page指令
5.
Sql Server 2008R2 安裝教程
6.
python:模塊導入import問題總結
7.
Java控制修飾符,子類與父類,組合重載覆蓋等問題
8.
(實測)Discuz修改論壇最後發表的帖子的鏈接爲靜態地址
9.
java參數傳遞時,究竟傳遞的是什麼
10.
Linux---文件查看(4)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
李宏毅——transformer
2.
2.Spatial Transformer Layer(李宏毅)
3.
李宏毅學習筆記15.Transformer
4.
李宏毅《Deep Learning》學習筆記 - transformer
5.
Transformer|深度學習(李宏毅)(八)
6.
李宏毅:spatial transformer (空間變換)
7.
【李宏毅】RNN
8.
李宏毅__ML_Notes_4.21
9.
李宏毅__ML_Notes_5.11
10.
【李宏毅】CNN
>>更多相關文章<<