panda核心數據結構

Series

Series是一維帶標籤的數組,數組裏能夠聽任意的數據(整數、浮點數、字符串、python Object)等等python

建立函數:sql

  (1)s = pd.Series(data,index=index),其中index是一個列表,用來做爲數據的標籤,若是不指定索引,pandas自動分配整形的索引數據庫

  (2)字典建立  s = pd.Series(dict,index = list('abcd')),建立的series對象的索引爲字典的key 數組

性質

Series對象的性質:數據結構

  類ndarray對象函數

  類dict對象spa

  標籤對齊操做3d

  結論一:series對象能夠直接使用ndarray對象方法

 

 

  結論二:series對象能夠像python字典對象同樣操做

 

  結論三:標籤對齊,進行操做時,索引自動對應作處理,若是找不到對應值,則爲NaN對象

DateFrame

  DateFrame是二維帶行標籤和列標籤的數組,能夠把DateFrame想象成一個Excel表格或一個sql數據庫的表格,還能夠想象成一個series對象字典,它是pandas裏最經常使用的數據結構blog

建立DateFrame對象

df = pd.DateFrame(data,index = index,columns = columns)    其中index是行標籤,columns是列標籤,data能夠是下面的數據結構:

  (1)由一維numpy數組,list,Series構成的字典

  (2)二維numpy數組

  (3)另外的DateFrame對象

字典方式建立:

(1)Series對象構成的字典方式建立:

  (2)列表構成的字典方式建立

  注意:由series對象構成的字典,series元素能夠不相等,但列表構成的字典,列表元素必須相等,否則會報錯

列表建立

  (1)列表中元素由元組構成

  

  (2)列表中元素由字典構成

 

 從Series建立DataFrame

  注意:series爲一維數組,故列索引只能有一列,否則會報錯

性質

  先建立一個數組

 (1)查找

 

(2)賦值

(3)刪除操做

(4)添加

(5)指定刪除並獲取結果

(6)指定位置插入

(7)assign在原來對象基礎上作操做但不會改變原對象數據結構

Panel

Panel是三維帶標籤的數組,Pancel比較少用,但依然是最重要的基礎數據結構之一.

Panel有三個標籤:

  items:座標軸 0,索引對應的元素是一個DataFrame

  magor_axis:座標軸1,DataFrame裏的行標籤

  minor_axis:座標軸 2,DataFrame裏的列標籤

建立方式:

  查看各維度索引

轉換爲DataFrame對象

相關文章
相關標籤/搜索