數據分析之matplotlib使用

繪製折線圖

參數詳情python

from matplotlib import pyplot as plt

# 設置圖片大小,dpi圖片放大縮小時可讓其更清晰
plt.figure(figsize=(20,8),dpi=80)

x = range(2,26,2)
y = [15,13,14.5,17,20,25,26,26,24,22,18,15]
# 繪圖
plt.plot(x,y)

# 保存圖片
# plt.savefig('./1.jpg')  # 也能夠保存爲矢量圖格式.svg 放大不會有鋸齒

# 設置x軸的刻度  就是將座標變成咱們想要展現的樣子
# plt.xticks(x)  # 可讀的密集和稀疏能夠經過調整x的步長
# plt.xticks(range(2,25))  # 可讀的密集和稀疏能夠經過調整x的步長
plt.xticks([i/2 for i in range(4,49,2)])

# 設置y軸刻度
plt.yticks(range(min(y),max(y)+1))

# 展現圖形
plt.show()

顯示中文的兩種方式

方式一:
加上下面這兩句話
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

方式二:
from matplotlib import pyplot as plt
from matplotlib import font_manager
my_font = font_manager.FontProperties(fname='字體路徑')
plt.xticks([i/2 for i in range(4,49,2)],fontproperties=my_font)  # 哪裏須要修改中文 就須要添加fontproperties

練習1dom

若是列表a表示10點到12點的每一分鐘氣溫,如何繪製折線圖觀察每一分鐘氣溫的變化狀況svg

a = [random.randint(20,35) for i in range(120)]字體

import random
import matplotlib
from matplotlib import pyplot as plt

# 設置中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

x = range(0,120)
y = [random.randint(20,35) for i in range(120)]
plt.figure(figsize=(20,8),dpi=80)

plt.plot(x,y)
# 設置顯示方式  設置x軸上字符串的刻度 10點0分 --- 11點59分
_xtick_labels = ['10點{}分'.format(i) for i in range(60)]
_xtick_labels += ['11點{}分'.format(i) for i in range(60)]
# print(_x_tickes)

plt.xticks(list(x)[::3],_xtick_labels[::3],rotation=45)  # 將x軸顯示的刻度旋轉45度

# 添加描述信息
plt.xlabel("時間")
plt.ylabel("溫度 單位(℃)")
plt.title("10點到12點每分鐘的氣溫變化狀況")
plt.show()  # matplolib默認不顯示中文

練習2spa

from matplotlib import pyplot as plt

a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
x = range(11,31)
plt.figure(figsize=(20,8),dpi=80)
plt.plot(x,a)

plt.xticks(x,["{}歲".format(i) for i in x])

plt.xlabel("年齡")
plt.ylabel("個數")
plt.title("每一年交男/女友的個數")

# 繪製網格
plt.grid(alpha=0.5)  # alpha設置網格透明度

plt.show()

練習33d

from matplotlib import pyplot as plt

y_1 = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
y_2 = [1,0,3,1,2,2,3,3,2,1,2,1,1,1,1,1,1,1,1,1]
x = range(11,31)
plt.figure(figsize=(20,8),dpi=80)

# 分別繪製我和同桌的交友信息
plt.plot(x,y_1,label="本身",color="cyan",linestyle=":")  # 定製折線風格
plt.plot(x,y_2,label="同桌",color="m",linestyle="-.")

plt.xticks(x,["{}歲".format(i) for i in x])

plt.xlabel("年齡")
plt.ylabel("個數")
plt.title("每一年交男/女友的個數")

# 繪製網格
plt.grid(alpha=0.5)  # alpha設置網格透明度

# 添加圖列  兩步:一、在繪圖的時候添加label參數;二、調用legend方法
# plt.legend(prop=my_font) # 顯示中文,只有在legend中顯示中文添加的參數是prop,其餘都是fontproperties
plt.legend(loc=2)  # loc能夠調節圖例位置
plt.show()

自定義折線顏色

繪製散點圖

練習code

繪製3月份和10月份的天氣變化狀況orm

import random
from matplotlib import pyplot as plt
# 設置中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 該數據是模擬3月和10月的天氣  random隨機生成的  
y_3 = [random.choice(range(1,20)) for i in range(1,32)]
y_3.sort() # 3月份天氣
y_10 = [random.choice(range(1,20)) for i in range(1,32)] 
y_10.sort(reverse=True) # 10月份天氣
print(y_3,y_10)

# x軸座標
x_3 = range(1,32)
x_10 = range(51,82) # 若是用同一個x軸畫兩次,圖像會重疊在一塊兒,因此將另外一個總體向右偏移
# 調整圖形大小
plt.figure(figsize=(20,8),dpi=80)

# 繪製散點圖 並添加圖列顯示信息
plt.scatter(x_3,y_3,label="3月份",color="orange")
plt.scatter(x_10,y_10,label="10月份",color="m")

# 調整x軸的刻度
_x = list(x_3)+list(x_10) # x軸全部的點
_x_label = ["3月{}號".format(i) for i in x_3]
_x_label += ["10月{}號".format(i-50) for i in x_10] # 由於x_10是從51開始的因此i須要減去50才能表明11月的每一日
plt.xticks(_x[::3],_x_label[::3],rotation=45)

# 添加描述信息
plt.xlabel("時間")
plt.ylabel("溫度")
plt.title("3/10月天天的氣溫變化狀況")
# 添加圖例
plt.legend(loc=1) # loc控制圖例顯示位置

# 顯示
plt.show()

繪製條形圖

練習blog

from matplotlib import pyplot as plt
# 設置中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 條形圖主要用來統計離散的數據
a = ["戰狼2","哪吒之魔童降世","流浪地球","復仇者聯盟4:終局之戰","紅海行動","美人魚","唐人街探案2","我不是藥神","速度與激情8","西虹市首富"]
b = [56.39,47.87,46.18,42.05,36.22,33.9,33.71,30.75,26.49,25.27]  # 單位(億)

# 更改大小
plt.figure(figsize=(20,8),dpi=80)
# 繪製條形圖,並設置條形圖的寬度
plt.bar(range(len(a)),b,width=0.2,label="電影票房")
# 設置x軸 
plt.xticks(range(len(a)),a,rotation=45)
# 繪製網格並這是透明度
plt.grid(alpha=0.5)
# 添加標籤
plt.xlabel("電影名")
plt.ylabel("票房 (億)")
plt.title("電影票房")
# 添加圖例
plt.legend(loc=1)

plt.show()

繪製橫着的條形圖

練習圖片

from matplotlib import pyplot as plt
# 設置中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 條形圖主要用來統計離散的數據
a = ["戰狼2","哪吒之魔童降世","流浪地球","復仇者聯盟4:終局之戰","紅海行動","美人魚","唐人街探案2","我不是藥神","速度與激情8","西虹市首富"]
b = [56.39,47.87,46.18,42.05,36.22,33.9,33.71,30.75,26.49,25.27]  # 單位(億)

# 更改大小
plt.figure(figsize=(20,8),dpi=80)
# 繪製條形圖,並設置條形圖的寬度
plt.barh(range(len(a)),b,height=0.3,color="orange")
# 設置y軸 
plt.yticks(range(len(a)),a)
# 繪製網格並這是透明度
plt.grid(alpha=0.5)
plt.show()

繪製屢次條形圖

練習

對比同一個電影在14/15/16這三天的票房狀況

from matplotlib import pyplot as plt
# 設置中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

a = ["猩球崛起3:終極之戰","敦刻爾克","蜘蛛俠:英雄歸來","戰狼2"]
b_16 = [15746,313,4497,319]
b_15 = [12357,156,2045,168]
b_14 = [2358,399,2358,362]

# 分別繪製14/15/16日的圖像  這種同用一組x軸的數據須要進行偏移,否則繪製出來的圖像會重疊在一塊兒
bar_width = 0.2   # 總體向右便宜0.2  範圍相加不能大於1
x_14 = list(range(len(a)))
x_15 = [i+bar_width for i in x_14]
x_16 = [i+bar_width*2 for i in x_14]

# 設置圖形大小
plt.figure(figsize=(20,8),dpi=80)

# 繪製圖像
plt.bar(x_14,b_14,width=bar_width,label="14日票房數據")
plt.bar(x_15,b_15,width=bar_width,label="15日票房數據")
plt.bar(x_16,b_16,width=bar_width,label="16日票房數據")

# 設置x軸
plt.xticks(x_15,a)  # 爲了讓電影名在中間顯示因此選擇x_15

# 添加圖列
plt.legend(loc=1)

# 添加描述信息
plt.xlabel("電影名")
plt.ylabel("電影票房 (億)")
plt.title("同一個電影近3天的票房數據")

plt.show()

繪製直方圖

 只有是沒有進行統計過的數據才能夠繪製直方圖

a=[131, 98, 125, 131, 124, 139, 131, 117, 128,108, 135, 131, 102, 107, 114, 119, 128, 121, 142, 127, 124, 101, 110, 116, 117, 110, 128, 128, 115, 99, 136, 126, 134, 95, 138, 117, 111,110, 132, 124, 113, 150, 110, 117, 86, 95, 144, 105, 126,130,126, 130, 126, 116, 123, 106, 112, 138, 123, 86, 101, 99, 136,123, 117, 119, 105, 137, 123, 128, 125, 104, 109, 134,125, 127,105, 120, 107, 129, 116, 108, 132, 103, 136, 118, 102, 120, 114,105, 115, 132, 145, 119, 121, 112, 139, 125, 138, 109,132, 134,156, 106, 117, 127, 144, 139, 139, 119, 140, 83, 110, 102,123,107, 143, 115, 136, 118, 139, 123, 112, 118, 125, 109,119, 133,112, 114, 122, 109, 106, 123, 116, 131, 127, 115, 118, 112, 135,115, 146, 137, 116, 103,144, 83,113,121,111,123,100, 154,136, 100, 118, 119, 133, 134, 106, 129, 126, 110, 111, 109, 141,120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114,125, 126,114, 140, 103, 130, 141, 117, 106, 114, 121, 114, 133, 137, 92,121, 112, 146, 97, 137, 105, 98, 117, 112, 111, 97,139, 113,134, 106, 144, 110, 137, 137, 111, 104, 117, 100, 111, 101, 110,105, 129, 137, 112, 120, 113, 133, 112, 124, 94, 146,133, 101,131, 116, 111, 84, 137, 115, 122, 106, 144, 109, 123, 116, 111,111, 123, 150]

import matplotlib.pyplot as plt

# 設置matplotlib正常顯示中文和負號
matplotlib.rcParams['font.sans-serif']=['SimHei']   # 用黑體顯示中文
matplotlib.rcParams['axes.unicode_minus']=False     # 正常顯示負號

# 設置圖像大小
plt.figure(figsize=(20,8),dpi=80)
# 計算組數
bin_width = 3  # 設置組距爲3
num_bins = (max(a)-min(a))+5//bin_width  # 組數 表示將數據分爲多少組
print(num_bins)
# 繪製直方圖
plt.hist(a,num_bins)  
plt.grid()
# 設置x軸刻度
plt.xticks(range(min(a),max(a)+bin_width,bin_width))  # 最小值---最大值 步長爲組距
plt.show()

上圖是頻數直方圖,咱們能夠經過normed參數來將其調整爲頻率直方圖

import matplotlib.pyplot as plt
import numpy as np
import matplotlib

# 設置matplotlib正常顯示中文和負號
matplotlib.rcParams['font.sans-serif']=['SimHei']   # 用黑體顯示中文
matplotlib.rcParams['axes.unicode_minus']=False     # 正常顯示負號
# 隨機生成(10000,)服從正態分佈的數據
data = np.random.randn(10000)
print(data)
"""
繪製直方圖
data:必選參數,繪圖數據
bins:直方圖的長條形數目,可選項,默認爲10
normed:是否將獲得的直方圖向量歸一化,可選項,默認爲0,表明不歸一化,顯示頻數。normed=1,表示歸一化,顯示頻率。
facecolor:長條形的顏色
edgecolor:長條形邊框的顏色
alpha:透明度
"""
plt.hist(data, bins=40, normed=1, facecolor="orange", edgecolor="black", alpha=0.7)
# 顯示橫軸標籤
plt.xlabel("區間")
# 顯示縱軸標籤
plt.ylabel("頻率")
# 顯示圖標題
plt.title("頻率分佈直方圖")
plt.show()

相關文章
相關標籤/搜索