1、推薦系統概念算法
一、推薦系統定義api
維基百科:推薦系統屬於資訊過濾的一種應用。推薦系統可以將可能受喜愛的資訊或實物(例如:電影、電視節目、音樂、書籍、新聞、圖片、網頁)推薦給使用者。分佈式
推薦系統大致可分爲兩類,即個性化推薦和非個性化推薦。oop
二、推薦系統做用性能
從用戶角度:大數據
從網站角度:網站
好的推薦系統更像一個有經驗的網站導購員搜索引擎
三、推薦系統與其餘系統的區別設計
推薦與搜索排序
相同點:幫助用戶找到商品
不一樣點:搜索是經過用戶主動輸入的關鍵字進行查詢。推薦則是用戶在瀏覽網站的過程當中,不必定須要用戶輸入,根據當前網頁的上下文進行個性化的信息輸出。
推薦與廣告
相同點:基於用戶行爲
不一樣點:廣告目的是幫助商家推廣商品等,推薦系統幫助用戶找到想要的商品等。
推薦與SNS
相同點:它們都有基於人羣的共同點產生推薦
不一樣點:一個是機器,一個是人工
四、推薦系統的主要產品
2、推薦系統的組成
一、數據
二、算法
算法須要配合大量業務規則,沒有最好,只有更好!
三、消息系統
消息系統是大型系統不可或缺的重要組成部分,與其餘系統解耦,消息轉發。
四、搜索引擎
主要功能是進行文本分析抽取關鍵詞,做爲推薦系統的一個信息檢索技術內容相關性匹配。
五、NoSQL
簡單、高性能、方便定製
六、分佈式計算
使用MapReduce , Hive、Hadoop進行大規模數據統計和運算和大數據集合的ETL
3、淘寶的推薦系統
一、淘寶數據特色
二、淘寶推薦系統應用場景
目前覆蓋大小場景60多個,主要包括
淘寶業務產品豐富,推薦功能穿插其中,推薦功能涵蓋的範圍更廣,不少場景推薦算法與業務規則相關。
三、淘寶推薦系統算法
①基礎算法:聚類算法,預測算法,分類算法等,主要用於產生基礎知識庫
②推薦算法:content-based,collaborative-based,Association Rules等等
基於內容推薦:經過給用戶和商品標註Tag,經過內容匹配算法,推薦商品給用戶
協同思想
關聯規則:類目的相關性、商品相關性、人的相關性
四、推薦系統的效果評測
五、淘寶推薦系統的設計
① 分佈是存儲:Treasure
②調度系統
③協調系統
總結:推薦系統是須要不斷創新而且與場景和行業有事緊密的關係