在搞推薦系統以前，請先避免這幾個問題

時間 2019-11-06

標籤推薦系統以前避免幾個問題简体版

原文原文鏈接

1、高估系統對用戶需求的捕捉能力程序員

咱們都說，搜索引擎是知足用戶主動需求的產品，而推薦系統則是知足用戶隱含需求的產品。當用戶明確須要什麼信息，就把需求轉化爲檢索詞，丟到搜索引擎，搜索引擎幫用戶找到它，而推薦系統則能良好的感知用戶未明確陳述的需求，爲其呈現信息。那麼問題來了，既然推薦系統可以捕捉用戶的需求，也就是說用戶還沒丟關鍵詞給搜索引擎以前已然知道用戶要什麼，直接爲用戶呈現出信息不更好？還須要搜索引擎幹嗎？！面試

固然更好，只是作不到。算法

用戶的需求是多變的，其中暗含着某些規律，但卻不可能被徹底的，完全的捕捉到，例如用戶瀏覽一個商品頁面，可能他對網頁上的產品感興趣，可能他被網頁上的代言吸引，可能他在爲朋友準備禮物，可能他在爲家人準備年貨，也可能只是誤操做罷了，這些細節被系統感知到的難度太大，因此咱們沒法知道用戶下一步要去作什麼，哪又如何推薦？微信

推薦系統有其邊界，一切技術均有其邊界，侷限於當前技術成熟度，侷限於數據，侷限於現實世界與技術世界的距離。當產品經理不瞭解技術的邊界，而技術人員則缺少產品思惟的時候，這種錯誤便容易發生。網絡

2、不顧用戶需求分佈式

系統良好的挖掘了用戶的需求，可是若是不顧場景，帶來的將是用戶巨大的反感。例如，咱們公認的基於社交網絡進行各類類型的推薦都是很是好的推薦思路：你所熟悉的人的行爲對你有着很是好的借鑑做用。這一點沒錯。可是通常而言，對商品的推薦仍是要放在商品售賣網站，對電影的推薦也請放在電影票售賣網站（我的以爲這個推薦應該放在相關的網站中，好比用戶在瀏覽產品的新聞的時候，也能夠進行推薦。固然如今這種狀況下的推薦可能是廣告）。瀏覽這些網站的用戶，都帶着強烈的隱含需求，但選錯了地方，每每造成對用戶的強制，安能不敗。學習

3、將「推薦」理解爲「推送」（這種狀況更多的是廣告）大數據

不妨變主動變被動，當下無數的互聯網產品都有一個「發現」模塊，包括微信，Twiiter等大量產品。用戶有需求的時候，會主動的找「推薦」，避免被打攪。而對於推薦系統，也避免對用戶造成打擾，引發用戶反感。網站

4、不顧用戶需求的「個性化」程度搜索引擎

咱們將推薦系統的目標進行簡化，假設它要解決的是點擊率/轉化率預估問題。那麼這些指標都與哪些因素有關？

平臺的因素

自己的魅力

信息形成的差別

用戶的羣體偏好

用戶的個性化偏好

5、總結

其中這幾個因素，有必定的界限，其對應的技術選型也不一樣，若是隻有平臺的因素，點擊率與轉化率遵循Beta分佈，只須要對這些值進行估計。而自己的魅力經過簡單的歷史信息統計即可獲得。信息形成的差別，則能夠經過典型的線性預估屬性特徵進行處理。而若是有強烈的羣體偏好，則能夠在線性預估模型裏面增長交叉特徵，可是若是個性化需求極其強烈，那麼協同過濾算法可能更加適合。

推薦系統的不一樣產品形態，其實就是「個性化」程度不一樣。沒有太強個性化類型的，這樣的推薦系統要解決的問題是「你們都喜歡什麼？」，簡單的統計便能搞定。對於多數廣告類產品，個性化需求太難以捕捉，要解決的問題是「什麼樣的人喜歡什麼樣的結果？」那麼線性模型屬性特徵交叉特徵更加適合。可是對於大多數推薦產品，尤爲是大平臺的推薦產品，去探索「每一個人喜歡什麼東西？」的個性化推薦技術可能更加適合。而不一樣的產品，選型哪怕相似，卻也或多或少隱含差別，例如社交網絡中的一些推薦產品，基於圖挖掘的推薦方式可能更加適合。

一句話，技術選型必須參照產品形態與用戶需求。

結語

感謝您的觀看，若有不足之處，歡迎批評指正。

若是有對大數據感興趣的小夥伴或者是從事大數據的老司機能夠加羣：

658558542 （☛點擊便可加入羣聊）

裏面整理了一大份學習資料，全都是些乾貨，包括大數據技術入門，海量數據高級分析語言，海量數據存儲分佈式存儲，以及海量數據分析分佈式計算等部分，送給每一位大數據小夥伴，這裏不止是小白彙集地，還有大牛在線解答！歡迎初學和進階中的小夥伴一塊兒進羣學習交流，共同進步！

最後祝福全部遇到瓶頸的大數據程序員們突破本身，祝福你們在日後的工做與面試中一切順利。

相關標籤/搜索