pandas中groupby的參數:as_index

參考:https://blog.csdn.net/cjsyr6wt/article/details/78200444?locationNum=11&fps=1spa

 

如下是pandas官方的解釋:.net

DataFrame.groupbyby = Noneaxis = 0level = Noneas_index = Truesort = Truegroup_keys = Truesqueeze = Falseobserve = False** kwargs code

as_index : bool,默認爲True對象

對於聚合輸出,返回以組標籤做爲索引的對象。僅與DataFrame輸入相關。as_index = False其實是「SQL風格」的分組輸出。blog

 

import pandas as pd

df = pd.DataFrame(data={'books':['bk1','bk1','bk1','bk2','bk2','bk3'], 'price': [12,12,12,15,15,17],'num':[2,1,1,4,2,2]})
print('df')

咱們來看一下輸出:索引

看一下as_index爲True的輸出:get

1 print(df.groupby('books',as_index=True).sum())

看如下as_index爲False的輸出:pandas

1 print(df.groupby('books',as_index=False).sum())

能夠看到爲True時 自動把第一列做爲了indexit

as_index爲True時能夠經過book的name來提取這本書的信息,如:io

1 df = df.groupby('books',as_index=True).sum()
2 print(df)
3 print('='*20)
4 print(df.loc['bk1'])

輸出爲:

 

具體的做用就是這樣了吧,有不一樣看法的能夠分享一下~

相關文章
相關標籤/搜索