DRN: A Deep Reinforcement Learning Framework for News Recommendation理解

這篇文章是微軟18年發的基於強化學習來做推薦系統的文章。 研究推薦系統一個月有餘,總覺得自己的模型過分簡單,單純的無腦過FC把人都整的蠢蠢的,於是就搜尋了一下有沒有別的方式來做推薦,就發現了這一篇文章,總體覺得還是很不錯的,記錄一下學習心得。 如果有理解錯的地方,還望各路大佬不吝賜教。 摘要 目前主流推薦算法沒有解決的問題: (1)大多數模型只用點擊率CTR來作爲目標函數 (2)鮮少有人嘗試利用用
相關文章
相關標籤/搜索