柱狀圖:python
import pandas as pd import matplotlib.pyplot as plt data = pd.read_csv('D:\\myfiles\\study\\python\\analyse\\數據團\\城市數據團_數據分析師_體驗課_課程資料\\數據資料\\地市級黨委書記數據庫(2000-10).csv', encoding='gbk') # 按省份分析市委書記女性比例 # 新建變量data_gender2,字段包括省份、性別 # 去除缺失值 data_gender2 = data[['省級政區名稱','性別']] data_gender2_re = data_gender2[data_gender2['性別'].notnull()] # 按照省份統計出男女人數 # crosstab(行,列)用於針對字符串數據的透視(相似excel的數據透視) pt = pd.crosstab(data_gender2_re['省級政區名稱'], data_gender2_re['性別']) # 計算出女性佔比 # 這裏直接在pt數據中添加了一個新的字段「女性佔比」 # sort_values()排序,ascending = False表示降序 pt['女性佔比'] = pt['女'] / (pt['女'] + pt['男']) pt2 = pt.sort_values(by=['女性佔比'], ascending=False) # 建立一個圖表,大小爲8*4 fig_q1_1 = plt.figure(figsize=(10, 5)) index = pt2.index[:10] # 取前十個 plt.bar(range(10), # 橫座標 pt2['女性佔比'][:10], # 縱座標 tick_label=index, # 橫軸標籤 color='blue') # 顏色 plt.title('不一樣省份女性市委書記佔比') plt.xlabel('省份') plt.ylabel('女性佔比') plt.show()
箱型圖:數據庫
import pandas as pd import matplotlib.pyplot as plt data = pd.read_csv('D:\\myfiles\\study\\python\\analyse\\數據團\\城市數據團_數據分析師_體驗課_課程資料\\數據資料\\地市級黨委書記數據庫(2000-10).csv', encoding='gbk') # 繪製圖表2:女性市委書記佔比結構 # 建立一個圖表,大小爲6*6 fig_q1_2 = plt.figure(figsize=(6, 6)) # 建立箱形圖:四分位數,上下邊緣值(非最大最小值),異常值 plt.boxplot(pt2['女性佔比'], # 值 vert=True, # true:縱向,false:橫向 showmeans=True) # 顯示均值 # 參數添加 plt.title('女性市委書記佔比結構') plt.xticks([]) plt.ylabel('女性佔比') plt.show()