1、reindex() 方法:從新索引
針對 Series
從新索引指的是根據index參數從新進行排序。
若是傳入的索引值在數據裏不存在,則不會報錯,而是添加缺失值的新行。
不想用缺失值,能夠用 fill_value 參數指定填充值。
例如:
fill_value 會讓全部的缺失值都填充爲同一個值,若是不想這樣而是用相鄰的元素(左或者右)的值填充,則能夠用 method 參數,可選的參數值爲 ffill 和 bfill,分別爲用前值填充和用後值填充:
針對 DataFrame
從新索引操做:
2、drop() 方法:丟棄數據
針對 Series
針對 DataFrame
不只能夠刪除行,還能夠刪除列:
3、索引、選取和過濾
針對 Series
須要注意一點的是,利用索引的切片運算與普通的 Python 切片運算不一樣,其末端是包含的,既包含最後一個的項。比較:
賦值操做:
針對 DataFrame
DataFrame 中的 ix 操做:
4、算術運算和數據對齊
針對 Series
將2個對象相加時,具備重疊索引的索引值會相加處理;不重疊的索引則取並集,值爲 NA:
針對 DataFrame
對齊操做會同時發生在行和列上,把2個對象相加會獲得一個新的對象,其索引爲原來2個對象的索引的並集:
和Series 對象同樣,不重疊的索引會取並集,值爲 NA;若是不想這樣,試試使用 add() 方法進行數據填充:
5、函數應用和映射
將一個 lambda 表達式應用到每列數據裏:
除了lambda 表達式還能夠定義一個函數:
6、排序
針對 Series
針對 DataFrame
7、排名
8、帶有重複值的軸索引
索引不強制惟一,例如一個重複索引的 Series: