Pandas所能知足的需求:數據庫
具有按軸自動或顯式數據對齊功能的數據結構。這能夠防止許多因爲數據未對齊以及來自不一樣數據源(索引方式不一樣)的數據而致使的常見錯誤。數組
集成時間序列功能數據結構
既能處理時間序列數據也能處理非時間序列的數據code
數據運算和約簡(好比對某個軸求和)能夠根據不一樣的元數據(軸)編號執行。對象
靈活處理缺失數據索引
合併及其餘出如今常見數據庫中的關係型運算pandas
Series是一種相似一維數組的對象,它由一組數據(各類Numpy數據類型)以及一組與之相關的數據標籤(即索引)組成class
Series的組成要素爲兩點:1.一組數據 2.與之對應的索引
建立:Series([data],index=[index])數據類型
"Data能夠是列表(省略index)" obj = Series([3,4,-5,6]) "經過Python字典建立:鍵值自動做爲索引" sdata = {'a':3,'b':4,'c':-5,'d':6} obj = Series(sdata) "自定義索引" obj = Series([3,4,-5,6],index=['a','b','c','d'])
應用:Series的方法方法
"經過索引選取單個值" In [7]: obj['a'] Out[7]: 3 "經過索引選取一組值" In [8]: obj[['a','c','d']] Out[8]: a 3 c -5 d 6 "數據組運算(Series能夠看做一維數組),保留索引和值之間的連接" obj[obj > 0] obj[obj*2] np.exp(obj2)
"還能夠將Series看成一個定長的有序字典" In [9]: "b" in obj Out[9]: True In [10]: "e" in obj Out[10]: False "Series實例方法" In [10]: obj.isnull() #檢測缺失數據 "Series的索引能夠經過賦值的方式就地修改" In [11]: obj.index = ['Bob','Steve','Jeff','Ryan'] Out[12]: Bob 3 Steve 4 Jeff -5 Ryan 6 dtype: int64