import numpy as np
import pandas as pd
from pandas import Series,DataFrame
df = DataFrame({'sex':['man','man','women','women','man','women','man','women','women'],
'age':[15,23,25,17,35,57,24,31,22],
'smoke':[True,False,False,True,True,False,False,True,False],
'height':[168,179,181,166,173,178,188,190,160]})
df
各類電子表格程序和其餘數據分析軟件中一種常見的數據彙總工具。它根據一個或多個鍵對數據進行聚合,並根據行和列上的分組鍵將數據分配到各個矩形區域中html
行分組透視表 設置index參數python
# 默認獲得一個平均值
df.pivot_table(index=[df.sex,df.smoke])
列分組透視表 設置columns參數app
df.pivot_table(columns=df.smoke)
行列分組的透視表 同時設定index、columns參數ide
df.pivot_table(index=df.sex,columns=df.smoke)
aggfunc:設置應用在每一個區域的聚合函數,默認值爲np.mean函數
df.pivot_table(index=df.sex,aggfunc=np.sum)
fill_value:替換結果中的缺失值工具
是一種用於計算分組頻率的特殊透視圖,對數據進行彙總spa
pd.crosstab(index,colums)code
pd.crosstab(index=df.sex,columns=df.smoke)