使用matplotlib 製圖(柱狀圖、箱型圖)

柱狀圖:python

import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('D:\\myfiles\\study\\python\\analyse\\數據團\\城市數據團_數據分析師_體驗課_課程資料\\數據資料\\地市級黨委書記數據庫(2000-10).csv', encoding='gbk')

# 按省份分析市委書記女性比例
# 新建變量data_gender2,字段包括省份、性別
# 去除缺失值
data_gender2 = data[['省級政區名稱','性別']]
data_gender2_re = data_gender2[data_gender2['性別'].notnull()]
# 按照省份統計出男女人數
# crosstab(行,列)用於針對字符串數據的透視(相似excel的數據透視)
pt = pd.crosstab(data_gender2_re['省級政區名稱'], data_gender2_re['性別'])
# 計算出女性佔比
# 這裏直接在pt數據中添加了一個新的字段「女性佔比」
# sort_values()排序,ascending = False表示降序
pt['女性佔比'] =  pt['女'] / (pt['女'] + pt['男'])
pt2 = pt.sort_values(by=['女性佔比'], ascending=False)
# 建立一個圖表,大小爲8*4
fig_q1_1 = plt.figure(figsize=(10, 5))

index = pt2.index[:10]  # 取前十個
plt.bar(range(10),  # 橫座標
        pt2['女性佔比'][:10],  # 縱座標
        tick_label=index,  # 橫軸標籤
        color='blue')  # 顏色
plt.title('不一樣省份女性市委書記佔比')
plt.xlabel('省份')
plt.ylabel('女性佔比')
plt.show()

  

 

箱型圖:數據庫

import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('D:\\myfiles\\study\\python\\analyse\\數據團\\城市數據團_數據分析師_體驗課_課程資料\\數據資料\\地市級黨委書記數據庫(2000-10).csv', encoding='gbk')


# 繪製圖表2:女性市委書記佔比結構
# 建立一個圖表,大小爲6*6
fig_q1_2 = plt.figure(figsize=(6, 6))
# 建立箱形圖:四分位數,上下邊緣值(非最大最小值),異常值
plt.boxplot(pt2['女性佔比'],  # 值
            vert=True,  # true:縱向,false:橫向
            showmeans=True)  # 顯示均值
# 參數添加
plt.title('女性市委書記佔比結構')
plt.xticks([])
plt.ylabel('女性佔比')
plt.show()

  

相關文章
相關標籤/搜索