圖解pandas模塊21個經常使用操做

點擊上方「超哥的雜貨鋪」,輕鬆關注
web


Pandas 是 Python 的核心數據分析支持庫,提供了快速、靈活、明確的數據結構,旨在簡單、直觀地處理關係型、標記型數據。Pandas 的目標是成爲 Python 數據分析實踐與實戰的必備高級工具,其長遠目標是成爲最強大、最靈活、能夠支持任何語言的開源數據分析工具。通過多年不懈的努力,Pandas 離這個目標已經愈來愈近了。數組


下面對pandas經常使用的功能進行一個可視化的介紹,但願能讓你們更容易理解和學習pandas。微信


一、Series序列數據結構

系列(Series)是可以保存任何類型的數據(整數,字符串,浮點數,Python對象等)的一維標記數組。軸標籤統稱爲索引。



二、從ndarray建立一個系列app

若是數據是ndarray,則傳遞的索引必須具備相同的長度。若是沒有傳遞索引值,那麼默認的索引將是範圍(n),其中n是數組長度,即[0,1,2,3…. range(len(array))-1] - 1]。函數


三、從字典建立一個系列工具

字典(dict)能夠做爲輸入傳遞,若是沒有指定索引,則按排序順序取得字典鍵以構造索引。若是傳遞了索引,索引中與標籤對應的數據中的值將被拉出。


四、序列數據的訪問學習

經過各類方式訪問Series數據,系列中的數據可使用相似於訪問numpy中的ndarray中的數據來訪問。spa


五、序列的聚合統計.net

Series有不少的聚會函數,能夠方便的統計最大值、求和、平均值等



六、DataFrame(數據幀)

DataFrame是帶有標籤的二維數據結構,列的類型可能不一樣。你能夠把它想象成一個電子表格或SQL表,或者 Series 對象的字典。它通常是最經常使用的pandas對象。




七、從列表建立DataFrame

從列表中很方便的建立一個DataFrame,默認行列索引從0開始。



八、從字典建立DataFrame

從字典建立DataFrame,自動按照字典進行列索引,行索引從0開始。


九、列選擇

在剛學Pandas時,行選擇和列選擇很是容易混淆,在這裏進行一下整理經常使用的列選擇。



十、行選擇

整理多種行選擇的方法,總有一種適合你的。






十一、返回指定行列

pandas的DataFrame很是方便的提取數據框內的數據。



十二、條件查詢

對各種數值型、文本型,單條件和多條件進行行選擇




1三、聚合

能夠按行、列進行聚合,也能夠用pandas內置的describe對數據進行操做簡單而又全面的數據聚合分析。





1四、聚合函數

data.function(axis=0) 按列計算

data.function(axis=1) 按行計算



1五、分類彙總

能夠按照指定的多列進行指定的多個運算進行彙總。




1六、透視表

透視表是pandas的一個強大的操做,大量的參數徹底能知足你個性化的需求。




1七、處理缺失值

pandas對缺失值有多種處理辦法,知足各種需求。



1八、查找替換

pandas提供簡單的查找替換功能,若是要複雜的查找替換,可使用map(), apply()和applymap() 



1九、數據合併

兩個DataFrame的合併,pandas會自動按照索引對齊,能夠指定兩個DataFrame的對齊方式,如內鏈接外鏈接等,也能夠指定對齊的索引列。



20、更改列名(columns index)

更改列名我認爲pandas並非很方便,但我也沒有想到一個好的方案。



2一、apply函數

這是pandas的一個強大的函數,能夠針對每個記錄進行單值運算而不須要像其餘語言同樣循環處理。



整理這個pandas可視化資料不易,

若是你以爲本文對其餘人有幫助,

請分享給你的朋友,感謝感謝。


以清淨心看世界;

用歡喜心過生活。


超哥的雜貨鋪,你值得擁有~


長按二維碼關注咱們


推薦閱讀:

1.一場pandas與SQL的巔峯大戰

2.一場pandas與SQL的巔峯大戰(二)

3.一場pandas與SQL的巔峯大戰(三)

4.一場pandas與SQL的巔峯大戰(四)

5.一場pandas與SQL的巔峯大戰(五)

6.一場pandas與SQL的巔峯大戰(六)

7.一場pandas與SQL的巔峯大戰(七)



本文分享自微信公衆號 - 超哥的雜貨鋪(gh_a624b94bfdab)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索