Python數據處理庫pandas基本使用

---恢復內容開始---函數

  pandas提供過便於操做數據的數據類型,也提供了許多分析函數和分析工具,使得數據分析易於操做。工具

 

1、pandas庫中Series類型對象

  Series能夠生成數據的索引(自動索引和自定義索引),見下例:blog

    

Series可從標量(必須有index)、字典(直接應用Series函數)、ndarray、列表構建。索引

  基本操做:相似於ndarray和字典類型。能夠用自定義索引b['b']=7, 也能夠用自動生成的自動索引b[1]=7,但注意不可混合使用。如get

b[['c', 'd', 0]]輸出的第三個元素爲NaN , 其切片和運算操做與ndarray基本相同,見下例:數據分析

    

 in 在列表或ndarray類型中表示某值是否在列表或ndarray中,而對於Series類型是判斷是否在對象的索引列表中。pandas

 b.get('f', 100) 返回索引值'f'對應的值,若沒有則返回100 。數據類型

 兩個Series類型a+b相加,獲得Series類型c,則c的索引值爲a和b索引值的並,c的值分爲兩種狀況,若索引值在a和b中都存在,則對應值相加;不然(只存在於a和b中的一個),對應值爲空。im

 能夠給Series對象起名字,如b.name='匹配'。

 

2、Pandas庫的DataFrame類型

  由索引和多列數據構成,能夠理解爲一個表格。其每列值的類型能夠不一樣,且既有行索引也有列索引,經常使用於表達二維數據。

可由二維ndarray對象、一維列表等、Series類型、其餘DataFrame類型建立。見下例:

    

 對於字典dl={'one':[1,2,3], 'two':[9,8,7]} 也可直接用pd.DataFrame(dt,index=['a', 'b', 'c', 'd'])來建立。

 若要得到某個位置的數據,須要用到行列的聯合索引,如d['a']['one']=1.0

 d['one']可得到one對應的一列對象,包括行索引值。

 d.ix['a']可得到a對應的一行對象,包括列索引值。

 

---恢復內容結束---

相關文章
相關標籤/搜索