按照pandas官網上10 Minutes to pandas的快速練習:數組
一 .對象建立:dom
導入練習所須要的工具包:函數
經過列表中的值建立序列Series,pandas在建立序列的同時會默認爲列表中值建立索引:(np.nan 爲空值)工具
經過NumPy數組建立DataFrame,同時默認建立時間索引和行標籤:(spa
np.random.randn(6,4) 介紹:從正太分佈中返回一個或多個樣本值 ,例子中表示返回6行4列的隨機數,不必定在(0,1]之間3d
np.random.rand(6,4)介紹:從(0,1]之間,產生6行4列的嵌套數組)code
經過將字典轉化爲相似序列Series的形式,建立DataFrame:對象
(pd.Categorical()函數:blog
pandas.
Categorical
(values,categories = None,ordered = None,dtype = None,fastpath = False )排序
values:像列表同樣,categories:類別,能夠定義類別,ordered:是否有序,dtype:categ的類型)
DataFrame每一列的數據類型:
使用<tab>可自動補全列名,並獲取指定列的值:
二.查看數據
查看frame的頭部和底部的數據:
顯示DataFrame的索引,列標題和值:
DataFram的函數describe(),快速分析彙總數據:
彙總指標:count:記數,mean:平均值,std:標準差,min:最小值,max:最大值
對DataFrame中的數據進行行列轉換:
按軸進行排序:(說明:axis=1,表示第一行,axis=0,表示第一列,降序排序)
按照值進行排序:
說明:按照'B'列,默認的升序進行排序)
三.獲取數據
經過列名獲取指定列名的列數據:
經過[],獲取指定範圍的切牌你數據:
經過標籤獲取數據:
經過標籤得到截面數據:
獲取多維截取數據:
獲取標量數據:
說明:at()函數的定位速度優於loc:
經過位置獲取數據: