淺談python的第三方庫——pandas(一)

pandas做爲python進行數據分析的經常使用第三方庫,它是基於numpy建立的,使得運用numpy的程序也能更好地使用pandas。python

##1 pandas數據結構數組

###1.1 Series 注:因爲pandas與numpy關係密切,因此在代碼中常常將兩者一同導入使用。數據結構

上圖中,先利用numpy建立一個一維數組,再利用pandas的內置方法將其轉換爲pandas的序列類型Series。能夠看到,pandas會自動將原有數據轉換成一列,並添加行的索引。3d

###1.2 DataFrame pandas的第二種也是最具表明性的數據結構就是DataFrame。blog

顯然,DataFrame就是矩陣類型的數據,只不過pandas中會給矩陣添加行列索引,以便使用與查找元素。索引

##2 建立DataFrame 因爲Series能夠視爲DataFrame的一種簡單狀況,因此後面將主要介紹DataFrame,關於Series的狀況能夠類比過去。 從前一小節能夠看到,pandas的數據能夠經過運用內置方法轉換numpy建立的數據獲得,但也能夠直接在pandas庫內建立DataFrame。數據分析

建立DataFrame時,能夠手動給數據添加行列名,不然pandas會自動添加形如「0,1,2,3」的行列名。 因爲pandas基於numpy製做,因此numpy中的一些經常使用方法能夠直接移植過來。pandas

pandas中也有shape方法查看矩陣大小。程序

##3 查找DataFrame的元素numpy

由於pandas中的矩陣容許自定義行列名,因此定位其中的元素分爲以下幾種方式:使用行列名稱,使用行列位置,名稱位置混合。

###3.1 行列名稱定位

###3.2 行列位置定位

###3.3 名稱位置混合定位

通常經常使用的仍是前兩種定位手段,混合定位瞭解便可。

小結:做爲pandas系列的開篇,本文就介紹到此,沿用numpy系列的模式,後面的博文將介紹pandas中關於DataFrame的經常使用方法。

相關文章
相關標籤/搜索