前言:python數據分析的基礎知識,簡單總結,主要是爲了方便本身寫的時候查看(大家可能看不太清楚T^T),發現有用的方法,隨時補充,歡迎指正
數據分析專欄:python
一、matplotlib模塊 pie(x,#繪圖數據 labels=None,#添加標籤 autopct='%.lf%%')#設置百分百格式 plt.show() 二、pandas模塊 Series.plot(kind='pie'#選擇畫圖類型 autopct='%.lf%%',#設置百分百格式 。。。 //用的時候查一查 )
一、matplotlib模塊 垂直條形圖: plt.bar(left,#x軸數據 height,#y軸數據 width=0.8,#條形圖寬度 。。。 //用的時候查一查,多用天然就會了 ) 水平條形圖: plt.barh(bottom=range(x.shape[0]#y軸的刻度 width=x.num,#指定y軸數值 tick_label=x.name,#指定y軸刻度標籤 ) 堆疊條形圖 +bottom參數便可 水平交錯條形圖 將刻度標籤向右偏移便可 plt.xticks(np.arange(5)+0.2,names) 二、pandas模塊 條形圖: x.plot(kind='bar',#選擇繪製的圖的類型 width=0.8, ax=axes[0]#豎向 ax=axes[1]#橫向 stacked=True#表示疊加值 ) 畫交錯圖: df=pd.DataFrame(np.random.randint(5,10,size=(10,4)),columns=['a','b','c','d']) plt=df.plot(kind='bar') 三、seaborn模塊這裏不做過多介紹
一、matplotlib模塊 plt.hist(x,#繪圖數據 bins=10,#直方條形個數 ) 二、pandas模塊 df.plot(kind='hist', bins=20,) //畫核密度曲線 df.plot(kind='kde', color='red') 三、seaborn模塊 sns.distplot(a,//數據 bins=10, hist=True, kde=True)
一、matplotlib模塊 plt.boxplot(x,//數據 notch=None, ) 二、seaborn模塊 繪製分組箱線圖 sns.boxplot(x,y data=None,#數據 hue=None,#指定分組變量)
sns.violinplot(x,y,#x,y軸 hue,#指定分組變量 data=None#數據 )
一、matplotlib模塊 plt.plot(x,y,#xy軸數據 label#標籤 ) 二、pandas模塊 data.plot(kind='line', style=['-','--',':']#畫圖格式 )
一、matplotlib模塊 scatter(x,y,#數據 s=20#大小 ) 二、pandas模塊 num.plot(x,y#標籤 kind='scatter' title='name' ) 三、seaborn模塊 sns.Implot(x,y,#數據標籤 hue='name'#指定分組變量 data='data_name'#數據 )
改變散點圖的s(大小)便可web
seaborn模塊 sns.heatmap(data='df'#繪圖數據 cmap='PuBuGn'#填充色 )