第六課: - GroupBy函數

第 6 課

 

讓咱們看一看 groupby 函數。html

In [1]:
# Import libraries
import pandas as pd import sys 
In [2]:
print('Python version ' + sys.version) print('Pandas version ' + pd.__version__) 
Python version 3.5.1 |Anaconda custom (64-bit)| (default, Feb 16 2016, 09:49:46) [MSC v.1900 64 bit (AMD64)]
Pandas version 0.20.1
In [3]:
# 咱們的小數據集
d = {'one':[1,1,1,1,1], 'two':[2,2,2,2,2], 'letter':['a','a','b','b','c']} # 創建數據幀 df = pd.DataFrame(d) df 
Out[3]:
  letter one two
0 a 1 2
1 a 1 2
2 b 1 2
3 b 1 2
4 c 1 2
In [4]:
#建立組對象
one = df.groupby('letter') # 應用求和函數 one.sum() 
Out[4]:
  one two
letter    
a 2 4
b 2 4
c 1 2
In [5]:
letterone = df.groupby(['letter','one']).sum() letterone 
Out[5]:
    two
letter one  
a 1 4
b 1 4
c 1 2
In [6]:
letterone.index 
Out[6]:
MultiIndex(levels=[['a', 'b', 'c'], [1]],
           labels=[[0, 1, 2], [0, 0, 0]],
           names=['letter', 'one'])
 
您可能不但願經過索引獲得分組的列,這能夠很容易地實現,以下所示。
In [7]:
letterone = df.groupby(['letter','one'], as_index=False).sum() letterone 
Out[7]:
  letter one two
0 a 1 4
1 b 1 4
2 c 1 2
In [8]:
letterone.index 
Out[8]:
Int64Index([0, 1, 2], dtype='int64')

This tutorial was rewrited by 六尺巷人_CDSpython

相關文章
相關標籤/搜索