【論文筆記】Deep Reinforcement Learning for Page-wise Recommendations

  1、Introduction 這裏主要介紹了:強化學習是可以根據用戶實時的反饋,捕捉用戶的動態喜好,,實時更新策略(policy),還能實現長期收益的最大化。與其他不同的是,這裏是生成一個網頁的物品(網頁版商城),是2D的,而不是1D的流式推薦(手機版商城)。 (ps:對於手機用戶來說,一般用戶最關注的是第一個商品,把他最感興趣的放在第一個就好了,但是對於頁面來說,很難說用戶最喜歡關注哪個地方
相關文章
相關標籤/搜索