轉自: http://blog.sina.com.cn/s/blog_72e6be570101o62r.html
在電商數據運營中,對於客戶而言,有兩個很重要的指標對於擴大銷售規模是很重要的:第一,提升顧客重複購買次數;第二,提升客戶訂單中的Basket size(即購物籃件數)。而第二個指標提升Basket size,就是讓客戶從之前只購買一件產品的轉換到如今購買多件產品,從而提升整個購物籃的銷售金額,最大限度地實現銷售增加。html
可是如何挑出那些產品之間有關聯銷售的機會,從而造成相應的組合優惠套裝呢?去過零售商場的人都知道,常常看到很多組合的套裝打包在一塊兒優惠銷售,例如P&G的產品:飄柔洗髮水+玉蘭油沐浴露、海飛絲洗髮水+舒膚佳沐浴露等等。再例如本人蔘與撰寫的Excel疑難千尋千解之《Excel 2010 數據透視表大全》+《Excel 2010 操做與技巧》+《Excel 2010 函數與公式》在噹噹網上造成了一個促銷禮包,就說明該組合是顧客最喜歡購買的,而且是銷售比較好的組合。對於P&G的產品組合,背後必然有相應的數據進行支撐, 纔敢推出相應的優惠組合套裝;而對於本人書本的組合,有多是噹噹網作了相應的分析,確認這三本書捆綁在一塊兒能產生最大的銷售機會,也有多是出版社經過 人爲的數據協助噹噹推出這樣的組合。但不管怎麼樣的決策,優惠組合套裝都離不開數據支撐,而這背後的原理就是涉及到數據挖掘中的關聯分析。提及關聯分析, 也許是太過於專業了,但連那些都不知道啥數據挖掘的最土鱉的那些土人都據說過啤酒與尿布的典型案例,啤酒與尿布就是關聯分析的典型,讓無數的人都對該規則 津津樂道,但這個都已經成爲過去了,如今數據增加及產品增加飛速,會出現愈來愈多啤酒與尿布的規則指導市場運營。結合本人的參與的電商數據挖掘、零售大商場的數據挖掘經驗,分享一點我對關聯分析的所謂經驗,幫助他人或幫助本身不斷提升。數據庫
第1、關聯分析具體能用來作什麼呢?編程
能夠一句話來歸納:最大限度地從你口袋裏面掏出更多的錢買個人產品。函數
- 經過關聯規則,推出相應的促銷禮包或優惠組合套裝,快速幫助提升銷售額。如前面所說的:飄柔洗髮水+玉蘭油沐浴露、海飛絲洗髮水+舒膚佳沐浴露等促銷禮包;還好比全家裏面推出的牛奶+麪包、豆奶+麪包的早餐組合。
- 零售超市或商場,能夠經過產品關聯程度大小,指導產品合理擺放,方便顧客最購買更多其所須要的產品。最多見的就是超市裏面購買肉和購買蔬菜水果等貨架會擺放得很近,目前就是不少人會同時購買肉與蔬菜,產品的合理擺放也是提升銷售的一個關鍵。
- 進行相關產品推薦或者挑選相應的關聯產品進行精準營銷。最 常見的是你在亞馬遜或京東購買產品的時候,旁邊會出現購買該商品的人,有百分之多少還會購買以下的產品,快速幫助顧客找到其共同愛好的產品。物以類聚,人 以羣分。例如,窮人通常和窮人在一塊兒,富人也喜歡和富人在一塊兒。還有數據挖掘的人喜歡和數據挖掘的人打交道,都離不開這些鳥道理。
- 尋找更多潛在的目標客戶。例如:100人裏面,購買A的有60人,購買B的有40人,同時購買A和B的有30人,說明A裏面有一半的顧客會購買B,反推而言。若是推出相似B的產品,除了向產品B的用戶推薦(由於新產品與B的功能效果比較相似)以外,還能夠向A的客戶進行推薦,這樣就能最大限度地尋找更多的目標客戶。
注:以上的具體應用場景是目前本人知識範圍內能想到的且都用在實際場景的。工具
第2、如何作好關聯分析呢?大數據
- 必須進行大量的產品梳理工做,區分不一樣等級的層次關係,而且給相應的產品打上合適的標籤。產品梳理是一項純手工的而且須要耗費大量的人力及時間才能完成的。通常的企業,其產品不會不少,就好比P&G的產品或者其SKU數,也不過是幾千個,但產品梳理的標準是很重要的。產品標準過於粗放,對於後期的關聯分析意義不大;產品標準過於細化,如涉及到SKU的層面的話,關聯分析出的規則也不必定很理想。因此選定好一個比較合理的產品梳理規範,對於關聯分析的結果精準程度很重要。
由於不少SKU通常只有產品名稱及價格,對數據管理比較規範的企業會打上品牌標籤,其餘相應的信息都是須要進行手工梳理。具體的產品梳理示例以下:spa
若是對於大零售超市或商場,其SKU數通常都是幾十萬甚至上百萬,產品梳理工做是一項很痛苦的工做,但若是要從數據角度進行產品運營,建議能夠開展相應的產品梳理諮詢項目,經過半年多的產品梳理,造成標準化的產品梳理流程及產品目錄。過去的半年裏,在對某商場的產品梳理時候,發現目前的產品體系仍是漏洞百出,不少仍是很不規範的。作好關聯分析或數據運營,請從產品梳理工做開始。
- 建議選取SAS EM模塊裏面的關聯分析模塊。合適的工具是作好關聯分析的關鍵。我的使用過SPSS Clementine裏面的關聯分析模塊,其實其對數據格式要求很嚴格,但不符合常規的數據庫錄入的基礎源數據,操做也不算很簡單。R語言裏面的關聯分析缺陷也很多,別看目前大吹特吹R語言在大數據上的應用有多廣,前途有多光明,但咱們只是從業務角度去挖掘商業機會,不懂那些Java等更高級的編程。其實發現仍是SAS的EM模塊比較好用,純圖形化操做。
- 請深入理解關聯分析中的三度:置信度、支持度、提高度,同時不能忽略產品規模。若是規則的提高度很高,但其相關的置信度很小,說明其市場規模很小。市場經營必須同時考慮市場規模大小及精準程度大小的兩個維度。若是該規則真的很精準,但其受衆客戶就只有幾百個,對於銷售額而言,一點都沒有影響。而另一條規則雖然提高度不是很高,但其受衆客戶涉及了幾萬人,對該部分客戶進行營銷,可以有效地擴大規模,大幅提升銷售額。因此後期的營銷規則選取也必需要切合實際的商業應用。
第3、關聯分析有哪些後遺症?
- 注意購買產品贈送禮品的人爲因素影響規則。有些挖掘師或分析師在作出關聯分析後,看到了幾條提高度及置信度都很高的規則,就興奮不已地告訴客戶:我以爲產品A和產品B有很大的關聯性,從數字上看,捆綁銷售確定可以取得很好的銷售效果。當拿到這樣的結果的時候,客戶很鎮定地說:「你不知道咱們在某月的時候,大量開展了購買產品A便可免費贈送產品B的活動麼?」杯具,坑爹。對於這個時候的挖掘師是很悲催的。在篩選關聯規則的時候,必須對該企業過去一年開展的活動有了解,還必須對不一樣時間段的主推產品進行提早溝通,確保關聯規則不受人爲因素影響。
- 注意產品之間的位置擺放是否有很大的影響。在 零售大商場中,產品擺放的位置對產品關聯銷售會產生很大的影響的,由於關聯分析就是爲了更方便地讓顧客找到其須要的產品,購買更多其須要的產品。人流比較 大的兩個相隔貨架之間的產品關聯性比較大,在咱們項目中會發現很多的這樣規則。但其結果代表了貨架關聯性比較大,擺放在一塊兒就確定比較合理的。但在進行關 聯分析的時候,客戶更但願能從其餘不相隔的貨架之間找出更好的關聯銷售機會,這決定了後期的關聯規則挑選難題。
- 注意關聯推薦的規則合理性及流失成本的大小。後期的關聯推薦應用於主要是三個方面:一、重購:繼續購買原來的產品;二、升級:購買更高檔次的產品;三、交叉銷售:購買相關的產品。若是該規則的客戶原本是買了50塊錢的產品的,發現關聯規則裏面出現了推薦其購買30塊的同類型產品,這等於給客戶降檔推薦了,會讓銷售額大幅減小,銷售機會白白浪費而且形成了損失,因此在進行關聯推薦的時候,那些涉及到了降檔的規則必定要剔除。
關聯分析是一個頗有用的數據挖掘模型,可以幫助企業作不少頗有用的產品組合推薦、優惠促銷組合,同時也能指導貨架擺放是否合理,還可以找到更多的潛在客戶,的確真正的把數據挖掘落到實處。