第一篇:你不必定了解的"推薦系統"

前言

       [推薦系統 - 基礎教程]多是穆晨的全部博文裏,最有趣最好玩的一個系列了^ ^。算法

       做爲該系列的[入門篇],本文將輕鬆愉快地向讀者介紹推薦系統這項大數據領域中的熱門技術。網絡

爲何要有推薦系統?

       從字面意義來看,推薦系統,就是向各位讀者們推薦物品的系統。因而你們天然會想到推銷......機器學習

       顯然,這並很差玩,由於誰也不想被人打擾,而這個"推銷系統"也不是本系列教程要講解的推薦系統。工具

       該問題的根本緣由在於:傳統推薦方式太low了;而一個可能讓讀者們感到詫異的事實是:大家已經開始頻繁使用推薦系統了,並且還用得很爽。學習

       不相信?那麼咱們來一一列舉吧!大數據

       1. 你用過聽歌軟件吧?相似網易雲音樂、QQ音樂、蝦米音樂:網站

       2. 你上過網上書店買書吧?相似噹噹、京東書城、卓越書城:搜索引擎

       3. 來個新穎點的...你玩過王者榮耀吧?下面截圖你懂的:人工智能

       4. 再來個新穎點的...你仍是單身嗎?據說世紀佳緣、珍愛網這些婚戀網站的對象推薦系統也作得很不錯:spa

  

       5. 其餘應用:推薦社交網絡好友、推薦新聞文章、推薦美食......太多太多,這裏就不一一例舉了。

真的不須要推薦系統?

       即便筆者舉了上述例子,相信仍有讀者不服,表示他們不須要推薦系統。

       這羣讀者應該主要分爲三類:

       1. A類讀者:我就須要那些熱門物品;   --- 排行榜是個好東西,但啥都和別人同樣,豈非太無趣了?

       2. B類讀者:我喜歡本身去搜索我須要的物品;   --- 難道沒試過忽然想看本書,但糾結買哪本好?

       3. C類讀者:我以爲推薦系統侵犯了個人隱私;   --- 那您放棄的可能不僅是推薦系統,而是整個互聯網了。

       不論這三類讀者有沒被說服,不能否認的是,對於大部分人來講,已經開始擁抱這個新生事物。

       另小道消息稱,亞馬遜20%以上的營業額就是經過推薦系統實現的。這不僅僅是說明推薦系統對物品購買行爲有影響,更說明對物品銷售行爲有影響:你也許不但能用推薦系統買東西,還能用推薦系統賣東西

推薦系統的本質

       推薦系統其本質,是爲了幫助人們解決信息過載(Information Overload)問題的一項工具。

       所謂信息過載,是指你所真正須要、真正感興趣的東西,被淹沒在其同類物品的海洋裏。所以,爲了找到它,你須要耗費巨大的時間和精力。爲了解決信息過載問題,截至至今,人們經歷了分類目錄、搜索引擎、推薦系統三個階段。

       下文將以信息檢索爲例,說明人們檢索方式(或者能夠理解爲解決信息過載方式)的演化:

        在N年前,筆者熱衷於使用相似5566這樣的導航網站檢索信息:

       該網站將其餘網站分門別類地整理好,我對哪一個類標籤感興趣就可點進去瀏覽相關網站信息。這就是所謂"分類目錄"的檢索方式。

       ● 後來,有了百度。筆者直接往裏面輸入關鍵字,它就能提供我想要的網頁,這讓我以爲信息檢索的效率更高了:

       這就是所謂「搜索引擎」的檢索方式。直至今天,它依然是信息檢索的最主流方法。

       ● 再後來,筆者發現QQ常常給我彈出相似這樣的信息:

       這就是所謂「推薦系統」的方式了:咱們不須要主動告訴系統咱們對哪類數據感興趣,也不須要提供關鍵字,系統根據咱們的歷史行爲、偏好數據,將咱們須要的信息提供給咱們。

       仔細一想,這不就是從海量的數據中挖掘知識,這不正是數據挖掘的定義麼?等等,那推薦系統和數據挖掘有什麼關係?好吧,再發散一下,大數據、數據挖掘、機器學習、人工智能、推薦系統等等這些概念又有什麼關係?

       哈哈,是否是有點暈了?這幾個問題就留給讀者自行思考吧,思考的過程,也是咱們提高對大數據,或者說對數據自己理解的過程。

小結

       閱讀完本文,讀者已經體會到了推薦系統的重要意義了吧。

       那麼,推薦系統的"後臺"是如何經過創建"高大上"的算法模型,從海量數據中精準地爲用戶篩選出其感興趣的物品,並將之推薦給用戶呢?

       這就是本系列博文後面將要涉及到的重點內容了。歡迎讀者關注,和穆晨一塊兒探討研究當今火熱的推薦系統技術~!

相關文章
相關標籤/搜索