在平常工做中,枯燥的文字說明經常會使人望而卻步,不如格式規範的表格容易讓人接受,但通俗易懂的圖表更會讓人耳目一新,賞心悅目。本文主要一個簡單的小例子,簡述Python利用Matplotlib實現數據可視化的相關應用,僅供學習分享使用,若有不足之處,還請指正。數組
當前公司人員冗餘,須要裁掉兩名實習生,可是具體裁掉哪一位,領導稍顯爲難,猶豫不定。關於兩名實習生的一年銷售額業績,以下表所示:學習
那到底哪一位實習生的銷售業績,及將來潛力更好呢?讓咱們經過可視化的方式進行對比。spa
工欲善其事必先利其器,要進行數據分析和可視化,首先是引入pandas模塊和matplotlib模塊,以下所示:3d
1 import pandas as pd 2 from matplotlib import pyplot as plt
無論是哪種圖表方式,第一步都是先讀取數據,本次讀取數據主要經過pandas進行數據處理,以下所示:excel
1 # pandas 讀取Excel,默認返回DataFrame類型,<class 'pandas.core.frame.DataFrame'>,屬於二維列表 2 data = pd.read_excel('test.xls', sheet_name=0) 3 # print(type(data)) 4 # print(data)
數據讀取到內存中,是一個二維列表,數據類型爲pandas.core.frame.DataFrame,是pandas中的數據類型,以下所示:code
Matplotlib主要經過plot方法繪製折線圖,以下所示:blog
1 plt.rcParams['font.family'] = ['sans-serif'] 2 plt.rcParams['font.sans-serif'] = ['SimHei'] 3 figure = plt.figure(figsize=(12, 6)) 4 plt.title('銷售額對比圖') # 標題 5 x = data['月份'] # x爲一維列表,數據類型: <class 'pandas.core.series.Series'> 6 y1 = data['張三'] # 張三銷售額 7 y2 = data['李四'] # 李四銷售額 8 # print(type(x)) 9 plt.plot(x,y1) # 基礎折線圖,採用描點連線的方式繪製 10 plt.plot(x,y2) 11 plt.show() # 彈出框展現
簡單設置後,生成的折線圖,以下所示:ip
經過上圖能夠看出兩位實習生的銷售額趨勢,孰優孰劣,可是上圖略顯粗糙,有一些地方表達差強人意,如:x軸,y軸的說明,兩條線分別表明什麼,須要更加細緻的設置,以下所示:內存
1 plt.rcParams['font.family'] = ['sans-serif'] 2 plt.rcParams['font.sans-serif'] = ['SimHei'] 3 figure = plt.figure(figsize=(12, 6)) 4 plt.title('銷售額對比圖') 5 x = data['月份'] # x爲一維列表,數據類型: <class 'pandas.core.series.Series'> 6 y1 = data['張三'] # 張三銷售額 7 y2 = data['李四'] # 李四銷售額 8 # print(type(x)) 9 plt.xlabel('月份') # x軸說明 10 plt.ylabel('銷售額') # y軸說明 11 plt.xticks(x, ['%d月' % i for i in range(1, 13)]) # 採用列表推導式生成數組 12 13 # label 表示線的標籤 color 表示線條的顏色,linestyle表示線條樣式,marker表示點的樣式 14 plt.plot(x,y1,label='張三',color='red',linestyle='--',marker='*') 15 plt.plot(x,y2,label='李四',color='green',linestyle='-.',marker='o')
16 plt.legend()ci
17 plt.show() # 彈出框展現
通過細緻設置後,兩位實習生的對比結果,以下所示:
關於示例中marker的設置,以下所示:
1 **Markers** 2 3 ============= =============================== 4 character description 5 ============= =============================== 6 ``'.'`` point marker 7 ``','`` pixel marker 8 ``'o'`` circle marker 9 ``'v'`` triangle_down marker 10 ``'^'`` triangle_up marker 11 ``'<'`` triangle_left marker 12 ``'>'`` triangle_right marker 13 ``'1'`` tri_down marker 14 ``'2'`` tri_up marker 15 ``'3'`` tri_left marker 16 ``'4'`` tri_right marker 17 ``'8'`` octagon marker 18 ``'s'`` square marker 19 ``'p'`` pentagon marker 20 ``'P'`` plus (filled) marker 21 ``'*'`` star marker 22 ``'h'`` hexagon1 marker 23 ``'H'`` hexagon2 marker 24 ``'+'`` plus marker 25 ``'x'`` x marker 26 ``'X'`` x (filled) marker 27 ``'D'`` diamond marker 28 ``'d'`` thin_diamond marker 29 ``'|'`` vline marker 30 ``'_'`` hline marker 31 ============= ===============================
關於示例的linestyle設置,以下所示:
1 **Line Styles** 2 3 ============= =============================== 4 character description 5 ============= =============================== 6 ``'-'`` solid line style 7 ``'--'`` dashed line style 8 ``'-.'`` dash-dot line style 9 ``':'`` dotted line style 10 ============= ===============================
若是經過折線圖,還不能決定孰優孰劣,那麼下面再以柱狀圖的形式來分析,以下所示:
1 plt.rcParams['font.family'] = ['sans-serif'] 2 plt.rcParams['font.sans-serif'] = ['SimHei'] 3 figure = plt.figure(figsize=(12, 6)) 4 plt.title('銷售額對比圖') 5 x = data['月份'] # x爲一維列表,數據類型: <class 'pandas.core.series.Series'> 6 y1 = data['張三'] # 張三銷售額 7 y2 = data['李四'] # 李四銷售額 8 plt.bar(x,y1) # 默認柱狀圖,兩根柱子會重疊 9 plt.bar(x,y2) 10 plt.legend() 11 plt.show() # 彈出框展現
通過上述設置後,初步柱狀圖以下所示:
經過上圖能夠看出兩位實習生的銷售額對比,孰優孰劣,可是一樣上圖略顯粗糙,有一些地方表達差強人意,如:x軸,y軸的說明,兩根柱子分別表明什麼,以及先繪製的圖的值比較小時,會被覆蓋,須要更加細緻的設置,以下所示:
1 plt.rcParams['font.family'] = ['sans-serif'] 2 plt.rcParams['font.sans-serif'] = ['SimHei'] 3 figure = plt.figure(figsize=(12, 6)) 4 plt.title('銷售額對比圖') 5 x = data['月份'] # x爲一維列表,數據類型: <class 'pandas.core.series.Series'> 6 y1 = data['張三'] # 張三銷售額 7 y2 = data['李四'] # 李四銷售額 8 9 plt.xlabel('月份') # x軸說明 10 plt.ylabel('銷售額') # y軸說明 11 plt.xticks(x, ['%d月' % i for i in range(1, 13)]) # 採用列表推導式生成數組 12 w = 0.4 # 柱子的寬度,默認爲1,這裏改成0.5 13 plt.bar((x - w / 2), y1, width=w, label='張三') 14 plt.bar((x + w / 2), y2, width=w, label='李四') 15 # 顯示文本 16 for i in range(0, 12): 17 plt.text(x=x[i] - w / 2, y=y1[i] + 5, s=y1[i], ha='center', va='center') 18 plt.text(x=x[i] + w / 2, y=y2[i] + 5, s=y2[i], ha='center', va='center') 19 plt.legend() 20 21 plt.show() # 彈出框展現
通過細緻設置後,兩位實習生的對比結果,以下所示:
相信若是將兩張圖展現給領導看,公司領導會很快作出決定【前提是兩位實習生背景簡單,都是憑實力吃飯的非關係戶】。關於Matplotlib的應用還有不少場景,本文旨在拋磚引玉,但願你們都能在工做生活中一路順風,事事如意。一首小詩,邀君共享。
《竹裏館》
【唐】王維