SparrowRecsys | 如何搭建一個超有成就感的推薦系統?

轉眼就開工了,7 天的假期,刷刷抖音,說走就走了。前端

 

說到抖音,就不得不提它的推薦系統,太 NB 了。刷了啥,馬上記住你的偏好,推薦類似內容,一不當心 2 小時就過去了,讓人慾罷不能,要麼日活 6 億呢。數據庫

 

其實「推薦系統」從沒像如今這樣,影響着咱們的生活。除了抖音、快手這類短視頻,還有網購時,天貓、京東會爲你推薦商品;想看看資訊,頭條、知乎會爲你準備感興趣的新聞等等。緩存

 

而驅動這些巨頭進行推薦服務的,都是基於深度學習的推薦模型。服務器

 

想起 2019 年阿里的千人千面系統,促成了天貓「雙 11」 2684 億成交額。假設經過改進商品推薦功能,使平臺總體的轉化率提高 1%,就能在 2684 億成交額的基礎上,再增長 26.84 億。這就是推薦工程師的最牛的地方,也是爲啥人能拿百萬年薪的緣由。微信

 

但在一個成熟的推薦系統上,找到提高的突破點並不容易——不能知足於協同過濾、矩陣分解這類傳統方法,而要創建起完整的「深度學習推薦系統」知識體系,加深對深度學習模型的理解,以及大數據平臺的熟悉程度,才能實現總體效果上的優化。架構

 

因此春節假期除了刷抖音,我又從新看了看《深度學習推薦系統》這個專欄,2 刷有很多新的啓發。做者王喆,Roku 推薦系統架構負責人,也是咱圈裏的大佬,一直深耕在推薦系統、計算廣告領域,經驗很是豐富。他以前出過同名的書,豆瓣評分 9.3,至關高。app

 

當年我看書的時候,就感受實踐太少,偏模型原理。因此在據說王喆開了個實踐專欄時,第一時間就訂閱了,跟着學下來,受益不淺。讓我完整地把推薦系統的原理捋了一遍。下面王喆總結的「核心知識圖譜」,建議收藏。框架


最重要的是,實操性特別強。王喆特意爲了這個專欄,開發了一個開源項目「 SparrowRecsys」,能讓你親手嘗試,搭建一套完整的深度學習推薦系統(下面有詳細介紹,賊有意思)。能夠說是書的實踐版本,裏面加入了更多技術細節的實現和討論。機器學習

 

絕不誇張的說,這個專欄讓我對深度學習推薦系統的認知,提高到了一個新高度,因此很想把它推薦給你。最近這個專欄要漲價到 ¥129 了,如今到手僅 ¥69 ,必定別錯過了,掃碼免費試讀👇ide

 

秒殺+口令「shendu666

到手僅 ¥69 ,即將漲至 ¥129

 

 

王喆這課,爲啥值得買?

 

先來講說這個 SparrowRecsys 推薦系統。王喆把它叫作「麻雀推薦系統」,取「麻雀雖小、五臟俱全」之意,它利用了開源的 movielens 數據集,搭建起了包括:

Spark、Flink 特徵工程

TensorFlow 深度學習模型訓練

TensorFlow Serving 模型服務

Redis 在線特徵數據庫

Jetty Server 推薦服務器

JS 前端實現

 

以上這些在內的,一整套深度學習推薦系統。不說它能支撐起一箇中大型公司的推薦系統,可是毫無疑問,它能夠成爲一個工業級推薦系統的種子項目。而這一切,都能在課程裏,一步步嘗試搭建起來。

 

最後你實現的推薦系統會是這個樣子👇

 

SparrowRecSys的首頁

 

SparrowRecSys的類似電影推薦頁

 

在這些前端頁面的背後,是你能實現的一個又一個深度學習模型

 

  • 對於電影的類似推薦功能,王喆會使用各類 Embedding based 的方法,好比 item2vec,graph embedding 等等。

  • 對於推薦功能,會基於 TensorFlow 實現Embedding MLP,Wide&Deep,NerualCF,Two Towers,DeepFM,DIN 等等深度學習模型,而後使用 TensorFlow serving 去進行模型服務。

  • 對於召回層、排序層這些推薦邏輯,也會全盤在基於 Jetty 的推薦服務器中實現。

 

整個項目總體的技術架構是下面這個樣子的:

 

SparrowRecSys的技術架構

 

是否是感受很牛。其次,專欄本計劃是 30 講,生生寫到 43 講,補充討論了不少熱門的問題。在這裏貼 15 個專欄裏討論的問題,看專欄留言區的討論,感受收穫更大。

 

 

最後說說,他是怎樣講解這門課程的?


總體遵循了經典推薦系統的框架,分爲 6 部分,學懂了,實現一個工業級的深度學習推薦系統,不成問題,簡單介紹下:

 

基礎架構篇:講要從 0 開始實現的推薦系統, Sparrow RecSys 的主要功能和技術架構,也會用到 Spark、Flink、TensorFlow 等業界最流行的機器學習和大數據框架。

 

特徵工程篇:討論推薦系統會用到的特徵,以及主要的特徵處理方式,並將其實踐在 Spark 上。此外,還有深度學習中很是流行的 Embedding、Graph Embedding 技術,並帶你實現 Sparrow Recsys 中的類似電影推薦功能。

 

線上服務篇:帶你搭建一個推薦服務器,包括服務器、存儲、緩存、模型服務等模塊和相關知識,涉及 Jetty Server, Spark、Redis 的使用。

 

推薦模型篇:深度學習推薦模型的原理和實現方法,包括 Embedding+MLP ,Wide&Deep,PNN 等深度學習模型的架構和 TensorFlow 實現,以及注意力機制、序列模型、加強學習等相關領域的前沿進展。

 

效果評估篇:效果評估的主要方法和指標,創建起包括線下評估、線上 AB 測試、評估反饋閉環等整套的評估體系,真正可以用業界的方法,而不是實驗室的指標來評價一個推薦系統。

 

前沿拓展篇:講 YouTube、阿里巴巴、微軟、Pinterest 等一線公司的深度學習應用,幫你追蹤業界發展的最新趨勢。

 

能夠說,王喆老師的書也好,課也好,從未叫人失望過,並且他人也特別 nice,常常在專欄下面跟讀者留言互動,這種耐心和責任心,真不是通常人有的。

 

好了,再強調一遍

專欄原價 ¥99,秒殺 ¥79

疊加優惠口令「shendu666

到手 ¥69,至關於半價了

立刻就漲到 ¥129 啦

 

 

👆掃碼免費試讀

 

沒計劃的學習,都只是做秀。與其花時間找一堆資料,還不若有計劃的消化一個系統的課,更值。

 

👇點擊「閱讀原文」,記得用口令「shendu666」,到手僅¥69,立刻漲價到 ¥129 了。

本文分享自微信公衆號 - NewBeeNLP(NewBeeNLP)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索