利用Python進行數據分析(8) pandas基礎: Series和DataFrame的基本操做

時間 2019-11-06

標籤利用 python 進行數據分析 pandas 基礎 series dataframe 基本欄目 Python 简体版

原文原文鏈接

1、reindex() 方法：從新索引

針對 Series

從新索引指的是根據index參數從新進行排序。

若是傳入的索引值在數據裏不存在，則不會報錯，而是添加缺失值的新行。

不想用缺失值，能夠用 fill_value 參數指定填充值。

例如：

fill_value 會讓全部的缺失值都填充爲同一個值，若是不想這樣而是用相鄰的元素（左或者右）的值填充，則能夠用 method 參數，可選的參數值爲 ffill 和 bfill，分別爲用前值填充和用後值填充：

針對 DataFrame

從新索引操做：

2、drop() 方法：丟棄數據

針對 Series

針對 DataFrame

不只能夠刪除行，還能夠刪除列：

3、索引、選取和過濾

針對 Series

須要注意一點的是，利用索引的切片運算與普通的 Python 切片運算不一樣，其末端是包含的，既包含最後一個的項。比較：

賦值操做：

針對 DataFrame

DataFrame 中的 ix 操做：

4、算術運算和數據對齊

針對 Series

將2個對象相加時，具備重疊索引的索引值會相加處理；不重疊的索引則取並集，值爲 NA：

針對 DataFrame

對齊操做會同時發生在行和列上，把2個對象相加會獲得一個新的對象，其索引爲原來2個對象的索引的並集：

和Series 對象同樣，不重疊的索引會取並集，值爲 NA；若是不想這樣，試試使用 add() 方法進行數據填充：

5、函數應用和映射

將一個 lambda 表達式應用到每列數據裏：

除了lambda 表達式還能夠定義一個函數：

6、排序

針對 Series

針對 DataFrame

7、排名

8、帶有重複值的軸索引

索引不強制惟一，例如一個重複索引的 Series：

安裝步驟已經在首篇隨筆裏寫過了，這裏不在贅述。利用Python進行數據分析(1) 簡單介紹

接下來一篇隨筆內容是：利用Python進行數據分析(9) pandas基礎: 彙總統計和計算，有興趣的朋友歡迎關注本博客，也歡迎你們添加評論進行討論。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。