DRN: A Deep Reinforcement Learning Framework for News Recommendation理解

時間 2020-12-23

原文原文鏈接

這篇文章是微軟18年發的基於強化學習來做推薦系統的文章。研究推薦系統一個月有餘，總覺得自己的模型過分簡單，單純的無腦過FC把人都整的蠢蠢的，於是就搜尋了一下有沒有別的方式來做推薦，就發現了這一篇文章，總體覺得還是很不錯的，記錄一下學習心得。如果有理解錯的地方，還望各路大佬不吝賜教。摘要目前主流推薦算法沒有解決的問題：（1）大多數模型只用點擊率CTR來作爲目標函數（2）鮮少有人嘗試利用用