推薦系統的EE問題及Bandit算法

時間 2021-01-02

標籤 recommend&&EE 简体版

原文原文鏈接

E&E問題簡介問題描述條件：假設我們有K個準備推薦的item，每個item的回報的服從不同的概率分佈p_item，且分佈參數未知目標：如果有T次機會推薦，如何制定決策過程從而獲取最大的累積回報 See also：多臂賭博機問題（Multi-armed bandit problem, K-armed bandit problem, MAB）表現形式隨機式(stochastic bandit

>>阅读原文<<

相關文章

相關標籤/搜索

推薦系統算法實戰

推薦系統實戰

推薦系統實踐

推薦算法入門

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<