利用Python對咖啡館營業作一個簡單的數據分析


準備數據

一、導入python數據分析模塊三劍客:pandas\matplotlib\numpy 二、用read_excel()方法導入數據源 在這裏插入圖片描述 .輸出結果截圖以下(部分): 在這裏插入圖片描述 能夠看到有這些數據:訂單日期、市場類別、區域、產品類別、產品名稱、預計銷售成本、預計毛利、預計利潤、預計銷售額、銷售成本、存貨、毛利、利潤額、銷售額等等。python

數據清洗

一、缺失值的處理 在這裏插入圖片描述 能夠看到,這份數據很乾淨,沒有空值。缺失值查詢也能夠用info()方法。函數

若是數據中有缺失值,咱們能夠用dropna()方法進行刪除,或者用fillna()進行填充。大數據

二、重複值處理3d

不少數據都是有重複值的,這個在數據分析前必須刪除掉,否則影響結果的準確度,清洗方法爲drop_duplicates()。 在這裏插入圖片描述 結果顯示,無重複。完了,我找的這個數據多是別人已經清洗過的了,可能不須要我清洗了,打擾了。excel

數據分析

一、數據總體狀況把握,用shape方法查看維度。 在這裏插入圖片描述 結果顯示,這個數據有4248行,14列。cdn

二、用describe()方法進行描述性分析 在這裏插入圖片描述 從這個步驟,想必你已經看出Python的強大之處了,一個小方法,瞬間能夠查看各列數據的計數、平均數、極值、方差、4分位數等等。固然,若是你這樣寫:describe(include='all'),數據會更加詳細。blog

三、排序分析排序

好比我想看每一個產品利潤額從高到低的分析。 在這裏插入圖片描述 sort_values(by='利潤額')表示按利潤額排序,ascending=False表示降序排序,head()數據太大了,因此我用這個函數默認取前5個數據。圖片

四、數據分組(跟SQL中的分組同樣)數據分析

好比,我想看不一樣產品類別的利潤額大小。 在這裏插入圖片描述 我用groupby()查看了利潤額和銷售額,根據肉眼,你一下估計看不出利潤額哪一個大對不對?那能夠根據上面我介紹的排序知識來排序。 在這裏插入圖片描述 超快吧,要比excel方便對不對。

五、根據條件查詢數據

好比,我要看看哪些產品有負利潤。 在這裏插入圖片描述 發現普洱茶的部分產品不少是虧本的。也許你想,若是我只想查詢清涼茶的負利潤產品呢?也能夠的,在條件查詢中多加個條件就行了。如圖: 在這裏插入圖片描述 看到這裏,你應該能夠根據本身的分析需求運用條件格式暢所欲爲了吧。是否是比excel嵌套會好用一點呢,關鍵excel若是碰到大數據嵌套會,人會很崩潰。好比我有次看到同事爲了匹配數據一跑數據就是一兩個小時。這在Python裏是分分鐘的事。

六、條件複雜一點分析(透視表)

好比,我要看看不一樣區域清涼茶的利潤額和銷售額的求和、平均值、極值呢? 在這裏插入圖片描述 這就須要用到上圖展現中的pivot_table(),這就是透視表功能。這個功能可讓你實現各類複雜分析。但須要熟練。

七、增長一列,算利潤率

好比我要算利潤率,那麼我就得用利潤額除以銷售額,再換成百分比對不對?如圖: 在這裏插入圖片描述

數據可視化

一、各產品種類利潤額的圖 在這裏插入圖片描述 二、查看各類產品的利潤額分佈在哪些區間 在這裏插入圖片描述 這是一個簡單箱式圖能看出極值、特殊值、4分位值,中位數等等。

三、雷達圖

在這裏插入圖片描述 若是你們熟練了,就能夠在這個基礎上玩出各類花樣了。我將在接下來的時間裏,繼續作一些分析案例,但願能分享一些比較容易上手,又能符合數據分析行業實際工做的東西出來。

相關文章
相關標籤/搜索