JavaShuo
欄目
標籤
ICML 2019 | 強化學習用於推薦系統,螞蟻金服提出生成對抗用戶模型
時間 2019-12-06
標籤
icml
強化
學習
用於
推薦
系統
螞蟻
提出
生成
對抗
用戶
模型
简体版
原文
原文鏈接
將強化學習用於推薦系統,能更好地考慮用戶的長期效益,從而保持用戶在平臺中的長期滿意度、活躍度。可是,強化學習須要大量訓練樣本,例如,AlphaGoZero [1] 進行了 490 百萬局模擬圍棋訓練,Atari game 的強化學習在電腦中高速運行了超過 50 個小時 [2]。而在推薦系統的場景中,在線用戶是訓練環境,系統須要與用戶進行大量的交互,利用用戶的在線反饋來訓練推薦策略。該過程將消耗大量
>>阅读原文<<
相關文章
1.
ICML 2019 | 強化學習用於推薦系統,螞蟻金服提出生成對抗用戶模型(附論文下載鏈接)...
2.
ICML2019|一種基於強化學習的推薦系統(GAN用戶模型,佐治亞理工學院聯合螞蟻金服提出且已開源)...
3.
強化學習 2019 ICML
4.
java集成螞蟻金服
5.
雲原生時代,什麼是螞蟻金服推薦的金融架構?
6.
螞蟻金服分佈式鏈路系統SOFATracer學習筆記
7.
《推薦系統》基於標籤的用戶推薦系統
8.
2017螞蟻金服暑期實習生內推一面
9.
NLP-螞蟻金服
10.
從ICML 2019到NeurIPS 2019,支付寶再次亮相國際AI頂會
更多相關文章...
•
Eclipse 生成jar包
-
Eclipse 教程
•
網絡體系的構成和類型
-
TCP/IP教程
•
適用於PHP初學者的學習線路和建議
•
Kotlin學習(二)基本類型
相關標籤/搜索
螞蟻金服
推薦系統
螞蟻
實用推薦
生成模型
學習推薦
用戶
強化學習
服用
用於
NoSQL教程
MySQL教程
Hibernate教程
應用
文件系統
學習路線
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
正確理解商業智能 BI 的價值所在
2.
解決梯度消失梯度爆炸強力推薦的一個算法-----LSTM(長短時記憶神經網絡)
3.
解決梯度消失梯度爆炸強力推薦的一個算法-----GRU(門控循環神經⽹絡)
4.
HDU4565
5.
算概率投硬幣
6.
密碼算法特性
7.
DICOMRT-DiTools:clouddicom源碼解析(1)
8.
HDU-6128
9.
計算機網絡知識點詳解(持續更新...)
10.
hods2896(AC自動機)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
ICML 2019 | 強化學習用於推薦系統,螞蟻金服提出生成對抗用戶模型(附論文下載鏈接)...
2.
ICML2019|一種基於強化學習的推薦系統(GAN用戶模型,佐治亞理工學院聯合螞蟻金服提出且已開源)...
3.
強化學習 2019 ICML
4.
java集成螞蟻金服
5.
雲原生時代,什麼是螞蟻金服推薦的金融架構?
6.
螞蟻金服分佈式鏈路系統SOFATracer學習筆記
7.
《推薦系統》基於標籤的用戶推薦系統
8.
2017螞蟻金服暑期實習生內推一面
9.
NLP-螞蟻金服
10.
從ICML 2019到NeurIPS 2019,支付寶再次亮相國際AI頂會
>>更多相關文章<<