Pandas學習筆記系列:html
原文:https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/3-8-pd-plot/ 本文有刪改python
此次咱們講如何將數據可視化. 首先import
咱們須要用到的模塊,除了 pandas
,咱們也須要使用 numpy
生成一些數據,這節裏使用的 matplotlib
僅僅是用來 show
圖片的, 即 plt.show()
。git
import pandas as pd import numpy as np import matplotlib.pyplot as plt
這是一個線性的數據,咱們隨機生成1000個數據,Series
默認的 index
就是從0開始的整數,可是這裏我顯式賦值以便讓你們看的更清楚github
# 隨機生成1000個數據 data = pd.Series(np.random.randn(1000),index=np.arange(1000)) # 爲了方便觀看效果, 咱們累加這個數據 data.cumsum() # pandas 數據能夠直接觀看其可視化形式 data.plot() plt.show()
就這麼簡單,熟悉 matplotlib 的朋友知道若是須要plot一個數據,咱們可使用 plt.plot(x=, y=)
,把x
,y
的數據做爲參數存進去,可是data
原本就是一個數據,因此咱們能夠直接plot
。 生成的結果就是下圖:dom
咱們生成一個1000*4 的DataFrame
,並對他們累加學習
data = pd.DataFrame( np.random.randn(1000,4), index=np.arange(1000), columns=list("ABCD") ) data.cumsum() data.plot() plt.show()
這個就是咱們剛剛生成的4個column
的數據,由於有4組數據,因此4組數據會分別plot出來。plot 能夠指定不少參數,具體的用法你們能夠本身查一下這裏spa
除了plot
,常常會用到還有scatter
,這個會顯示散點圖,首先給你們說一下在 pandas
中有多少種方法3d
可是咱們今天不會一一介紹,主要說一下 plot
和 scatter
. 由於scatter
只有x
,y
兩個屬性,咱們咱們就能夠分別給x
, y
指定數據code
ax = data.plot.scatter(x='A',y='B',color='DarkBlue',label='Class1')
而後咱們在能夠再畫一個在同一個ax上面,選擇不同的數據列,不一樣的 color 和 labelhtm
# 將之下這個 data 畫在上一個 ax 上面 data.plot.scatter(x='A',y='C',color='LightGreen',label='Class2',ax=ax) plt.show()
下面就是我plot出來的圖片