【論文筆記】Deep Reinforcement Learning for Page-wise Recommendations

時間 2021-01-02

標籤強化學習推薦系統論文简体版

原文原文鏈接

1、Introduction 這裏主要介紹了：強化學習是可以根據用戶實時的反饋，捕捉用戶的動態喜好，，實時更新策略（policy），還能實現長期收益的最大化。與其他不同的是，這裏是生成一個網頁的物品（網頁版商城），是2D的，而不是1D的流式推薦（手機版商城）。（ps：對於手機用戶來說，一般用戶最關注的是第一個商品，把他最感興趣的放在第一個就好了，但是對於頁面來說，很難說用戶最喜歡關注哪個地方

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。