《Python for Data Analysis》之 Series

pandas的主要數據結構:Series


Pandas所能知足的需求:數據庫

  • 具有按軸自動或顯式數據對齊功能的數據結構。這能夠防止許多因爲數據未對齊以及來自不一樣數據源(索引方式不一樣)的數據而致使的常見錯誤。數組

  • 集成時間序列功能數據結構

  • 既能處理時間序列數據也能處理非時間序列的數據code

  • 數據運算和約簡(好比對某個軸求和)能夠根據不一樣的元數據(軸)編號執行。對象

  • 靈活處理缺失數據索引

  • 合併及其餘出如今常見數據庫中的關係型運算pandas


Series是一種相似一維數組的對象,它由一組數據(各類Numpy數據類型)以及一組與之相關的數據標籤(即索引)組成class

Series的組成要素爲兩點:1.一組數據 2.與之對應的索引
建立:Series([data],index=[index])數據類型

"Data能夠是列表(省略index)"
obj = Series([3,4,-5,6])

"經過Python字典建立:鍵值自動做爲索引"
sdata = {'a':3,'b':4,'c':-5,'d':6}
obj = Series(sdata)

"自定義索引"
obj = Series([3,4,-5,6],index=['a','b','c','d'])

應用:Series的方法方法

"經過索引選取單個值"
In [7]: obj['a']
Out[7]: 3
"經過索引選取一組值"
In [8]: obj[['a','c','d']]
Out[8]: 
a    3
c   -5
d    6
"數據組運算(Series能夠看做一維數組),保留索引和值之間的連接"
obj[obj > 0]
obj[obj*2]
np.exp(obj2)
"還能夠將Series看成一個定長的有序字典"
In [9]: "b" in obj
Out[9]: True

In [10]: "e" in obj
Out[10]: False

"Series實例方法"
In [10]: obj.isnull()  #檢測缺失數據

"Series的索引能夠經過賦值的方式就地修改"

In [11]: obj.index = ['Bob','Steve','Jeff','Ryan']

Out[12]: 
Bob      3
Steve    4
Jeff    -5
Ryan     6
dtype: int64
相關文章
相關標籤/搜索