在互聯網飛速發展的現代社會,人們天天都要受到成百上千條信息的轟炸,APP推送、新聞熱點、信息流廣告……一個有效的「信息過濾器」已經成爲了人們平常生活的剛需,也是信息供應商在激烈的市場環境中脫穎而出的必殺技。算法
推薦系統正扮演着這樣一個角色,它如同篩子通常,幫咱們找到最想要的內容。可是,推薦系統太高的技術門檻和研發成本把不少企業擋在了門外。第四範式基於機器學習技術推出的智能推薦產品先薦,專一於內容行業的個性化推薦,憑藉自身的技術優點有效解決着這一難題,已經服務了36氪、花瓣、果殼等知名媒體,不斷受到行業內的普遍好評。微信
在接下來的文章中,先薦將系統地講解推薦系統的相關知識,但願各位技術愛好者能對推薦系統有更多、更多的瞭解。首先,咱們將從推薦系統的工做流程講起。網絡
這一階段會收集用戶的相關信息,用以生成預測任務的用戶畫像,這些信息包括用戶屬性、用戶行爲或用戶訪問的資源。只有用戶畫像徹底創建後,推薦系統才能開始運行。推薦系統須要儘量多地瞭解用戶,這樣的話從一開始就能爲用戶提供合理的推薦結果。運維
推薦系統依賴於不一樣類型的輸入,例如最直接的顯式反饋,即用戶直接輸入感興趣的內容,或隱式反饋,即經過觀察用戶行爲間接地推斷用戶偏好,還能夠經過顯式和隱式反饋的組合來得到混合反饋。機器學習
以網絡學習平臺爲例,用戶畫像是與特定用戶相關聯的我的信息的集合。這些信息包括該用戶的認知技能、智力水平、學習方式、興趣愛好以及交互行爲等。用戶畫像一般用於用戶模型構建時信息檢索所需。換句話說,用戶畫像粗略地反映了用戶模型。要想作成功一個推薦系統,很大程度上取決於其對用戶興趣的表徵能力。要想得到準確的推薦結果,準確的用戶模型必不可少。post
網站通常會在用戶操做界面上提示用戶對內容作出評價,以便構建和改進該用戶的用戶模型。推薦結果的準確性取決於用戶提供的評級數量。用戶的評級數量越多,推薦結果越準確。顯式反饋的惟一缺點是,很是依賴用戶評級的積極性,並且,用戶不是時時刻刻願意作出評級。不過,相比之下,顯示反饋不涉及到從用戶行爲中獲取用戶偏好這一步,所以提供的數據更可靠,整個推薦過程也更透明,可以更好地感知推薦系統的質量,從而提升用戶滿意度。性能
網站後臺經過監測用戶的不一樣行爲,自動推測用戶的興趣偏好,例如購買歷史、導航歷史,在某些網頁上停留的時間、用戶點擊的連接、按鈕、以及電子郵件內容等。隱式反饋從用戶行爲中推斷用戶的偏好,減輕了用戶的評級負擔。隱式反饋對用戶評級的積極性要求不高,準確性也較低。學習
也有一些人認爲,用戶隱性反饋的數據實際上更客觀,在隱式反饋的狀況下,用戶不須要以社會大衆指望的方式作出反應,也沒有任何維護自我形象的需求,所以提供的數據更真實。網站
隱式和顯式反饋的優點能夠在混合系統中結合,以最大限度地下降兩者的不足並實現性能最佳的推薦系統。具體來看,用隱式反饋的數據來校驗顯式反饋的數據,或僅容許用戶在表達明確興趣時給出顯式反饋。3d
在這一階段,系統會經過學習算法,過濾上一階段獲得的用戶反饋,並提取用戶特徵。關於這一部分的詳細內容,咱們會在後續的文章中介紹。
在這一階段,系統會預測用戶可能喜歡的內容類型。這一步能夠直接基於在信息收集階段收集的數據集(基於存儲器或基於模型)來實現,也能夠經過後臺監測到的用戶行爲來實現。
在下一篇文章中,咱們將會詳細介紹推薦的過濾技術,敬請期待。
相關閱讀:
如欲瞭解更多,歡迎搜索並關注先薦微信公衆號(ID:dsfsxj)。