%matplotlib inline
import numpy as np
import pandas as pd
from scipy import stats,integrate
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(color_codes=True)
#生成高斯數據隨機種子
np.random.seed(sum(map(ord,"distributions")))
1.簡單的單變量數據特徵繪圖javascript
x=np.random.normal(size=100)
#畫直方圖bins自動分組
sns.distplot(x,kde=False)
在distplot()中改變bins的個數,將數據分紅30組css
sns.distplot(x,bins=30,kde=False)
2.查看數據分佈狀況html
x=np.random.gamma(6,size=200)
sns.distplot(x,kde=False,fit=stats.gamma)#fit=stats.gamma是擬合統計的曲線
3.根據均值和協方差生成數據html5
mean,cov=[0,1],[(1,.5),(.5,1)]
data=np.random.multivariate_normal(mean,cov,200)
df=pd.DataFrame(data,columns=["x","y"])
df
4.觀測兩個變量之間的分佈關係最好用散點圖python
sns.jointplot(x="x",y="y",data=df)
5.數據量大時經過顏色深淺來判別每一個區域的密度jquery
x,y=np.random.multivariate_normal(mean,cov,2000).T
with sns.axes_style("white"):#指定風格
sns.jointplot(x=x,y=y,kind="hex",color="k")
sns.jointplot(x=x,y=y,kind="kde",color="k")
sns.jointplot(x=x,y=y,kind="reg",color="k")
5.用鳶尾花數據來繪製兩個變量間的關係圖linux
iris=sns.load_dataset("iris")
sns.pairplot(iris)