一文讀懂 Netflix 的推薦探索策略 Contextual Bandits

作者 | 張相於 爲了文章的簡潔性,本文省略了大量原文的文字和圖片,只保留了筆者認爲比較核心的內容,對原文有興趣的同學歡迎閱讀原文。 這篇文章講述了Netflix對用戶看到的視頻封面進行個性化篩選的方法,但更具有普適性意義的是以此案例爲載體的contextual bandit exploration方法,以及基於replay的離線效果無偏評估方法。 What & Why 本文要解決的核心問題是在N
相關文章
相關標籤/搜索