趣味分析系列 | 文胸品牌知多少(一)

一年一度的聖誕節立刻就快到了,各位男神是否是又在勞神費力地給女神們準備聖誕節禮物?今年送啥呢?瀏覽器

送腦白金怎麼樣?NO,NO,NO!腦白金是送給大媽的!!!code

直接給MONEY? NO,NO,NO!太俗氣!!!內存

送鮮花與巧克力?NO,NO,NO!不實在!!!get

按我說,直接送個文胸套裝,有情調又貼心!!!說不定你的女神會給你個驚喜呢!源碼

可是問題又來了,挑選哪一個品牌的文胸好呢,總不能送一個層次太LOW的吧。所以,你須要對文胸的品牌有個大概的瞭解。簡單講,首先你得了解女生文胸品牌有多少?品牌的排名度是怎樣的?爲了減小各位男神上網的搜索時間,看我下面仔細分析給你看!數據分析

1、數據準備it

打開瀏覽器上某東,祭出咱們的F12神器,而後把以下網頁代碼複製下來(還不會?來找我,我當面告訴你,教到你會爲止!)。coding

源碼稍做處理以下:互聯網

2、分析過程搜索

一、把數據上傳到OpenFEA(請訪問www.openfea.cn的下載專區,能夠在互聯網上搭建的在線試用環境中跟我一塊兒分析),以下圖:

二、加載數據到內存DF表

三、數據分析與處理

(1)數據行列轉換

(2)字段重命名與數據打標籤

(3)數據過濾

(4)數據提取

(5)數據合併

(6)存儲結果數據

(7)結論

女生文胸品牌總共有1240個,各位男神慢慢了解吧,我只能幫你到這了。

3、分析腳本

#加載數據

df1 = load csv by jd_goods.txt with (encoding="gbk",sep="=",header=-1)

#行列互換

df2 = @udf df1 by udf0.df_T

rename df2 as (0:"content")

#數據打標籤

df2.flag1 = str content by (contains("brand-"))

df2.flag2 = str content by (contains(u'品牌'))

df3 = filter df2 by (flag1==True)

df4 = filter df2 by (flag2==True)

#數據分析與提取

df3.brandno =str content by (findall("(\d+)"))

df3.brand_code=str brandno by (get(0))

df4.brands = str content by (split("::"))

df4.brands_1=str brands by (get(1))

df4.brand_name = str brands_1 by ([0:-8])

#數據合併

df3 = add idx1 by (range(df3.index.size))

df4 = add idx2 by (range(df4.index.size))

df5 = join (df3,df4) by (idx1,idx2)

df6 = loc df5 by (brand_name,brand_code)

#存儲數據

store df6 to csv by jd_goods.csv

<煩請關注,下期內容更精彩!>

趣味分析系列  |  文胸緯度分析360度(罩杯、顏色......)(二)

趣味分析系列  |  女神在哪裏(三)

更多文章,敬請期待......

相關文章
相關標籤/搜索