LinUCB算法理解

解決的問題 1、UCB的算法context-free: 沒有充分利用推薦場景的上下文信息,爲所有用戶的選擇展現商品的策略都是相同的,忽略了用戶作爲一個個活生生的個性本身的興趣點、偏好、購買力等因素都是不同的,因而,同一個商品在不同的用戶、不同的情景下接受程度是不同的 原理 1、每個arm維護一個特徵向量: θ α \theta_{\alpha} θα​ 2、假設 : 每個arm的期望收益爲ar
相關文章
相關標籤/搜索