原論文在UMAP'16。文章並無過高深的模型,比較接地氣;但其觀點與結論很獨到,而且在工業界具備很強的實際操做價值。session
針對推薦系統的研究大多關注在挖掘用戶並不知道可是卻與其興趣相關的物品。不過每一個推薦系統所在的領域都有其各自的特色,本文所討論的是電商領域的推薦系統,在電商領域中,給用戶適當地推薦其過去曾經瀏覽過(或者消費過)的物品(reminders)一樣具備必定的價值。網站
實驗證實,在推薦結果中同時包含有reminders以及協同過濾(CF)等推薦方式的結果時,具備最好的效果。可是在推薦reminders時候也有不少須要改進的點:(1)如何避免太過明顯的重複瀏覽的商品,避免已經無效商品(下架等);(2)如何推薦與用戶當前購物需求相關的reminders。3d
首先,文章分析了用戶對於電商網站的推薦內容中的reminders的接受度。以Zalando網站(一家歐洲的在線購物網站)爲例,抽樣了3000個重度用戶,他們對18w+的商品有過310w量級左右的商品瀏覽記錄,以及10w+的購買記錄。對於這些用戶,從日誌中分析出有一下幾個重要點:日誌
1. 一個用戶的購物session中平均有9次商品的瀏覽行爲;平均每3次購物session會轉化爲一次購買行爲。blog
2. 在推薦的商品中,有約1/10的商品是reminders,即用戶以前已經瀏覽過這些商品;有約1/4的推薦列表中包含有至少一個reminders。排序
3. 在成功推薦的商品(在同一次session中,用戶對該商品的點擊瀏覽行爲最終轉化爲購買行爲)中,有約40%的商品爲reminders。rem
4. 在用戶最終轉化成購買行爲的reminders中,用戶對這些商品在此前有過若干次的瀏覽行爲。以下圖所示:有成功推薦商品數與用戶距離對該商品首次瀏覽時候的天數間隔的關係;以及成功推薦商品數與用戶對該商品的瀏覽次數的關係。get
5. 在一次購物session中,用戶平均瀏覽的商品類目約爲2.7個,說明用戶在一次session中的意圖仍是比較有目的性的。it
reminders的推薦策略io
一個通用的流程是:
1. 獲取用戶在過去時間內有過瀏覽行爲的商品集合,並從中篩選出哪些商品能夠用做reminders。
2. 對這些reminders進行必定規則的過濾,並進行排序獲得最終的reminders推薦結果。
排序的策略有:
1. Interaction Recency(IRec)
對某商品的瀏覽行爲發生的時刻越接近,排序分越高。
2. Interaction Intensity(IInt)
對某商品的瀏覽行爲發生的次數越多,排序分越高。
3. Item Similarity(ISim)
有過瀏覽行爲的商品,與當前用戶的購物意圖(以當前實時瀏覽的商品來表示)越接近,排序分越高。
4. Session Similarity(SSim)
有過瀏覽行爲的session,與當前用戶的購物意圖(以當前實時瀏覽的session來表示)越接近,排序分越高。而後再對排序較高的session中的商品進行IInt策略的重排序。
Feature-based Category Filtering
在電商領域,用戶通常不多對相同類目下的商品進行重複購買,因此至少在必定時間間隔內,不該該給用戶推薦與其以前已經購買過的商品屬於相同類目的商品。
維護一個blacklist,對用戶已經購買過的商品,將其類目加入到這個blacklist中,直至其又從新開始瀏覽該類目的商品再將其移出blacklist。
爲了防止推薦商品太過於obvious,增長一個obvious gap的時間間隔,對於與當前時刻過近的時間段內用戶瀏覽過的商品 ,咱們不該當將其看做reminders。
版權聲明:
本文由笨兔勿應全部,發佈於http://www.cnblogs.com/bentuwuying。若是轉載,請註明出處,在未經做者贊成下將本文用於商業用途,將追究其法律責任。