pandas是python中的 一個數據處理庫,一樣在使用的時候咱們要先輸入import pandas as pd
引入。python
1.df = pd.read_csv("文件路徑")
:這是讀取csv文件的方法,若是要讀取excel或其餘文檔,都有相應的read函數。app
2.df.dtypes
:若是在文件中有字符型數據返回的是object。函數
3.df.head(n)
:將前n行數據顯示出來,若是不傳入參數則顯示前5行數據。spa
4.df.tail(n)
:將後n行數據顯示出來,若是不傳入參數則顯示後5行數據。excel
5.df.columns
:以列表的形式顯示數據表的列名。code
6.df.shape
:以元組的形式顯示錶中數據的行數和列數。排序
7.df.loc[n]
:返回索引值爲n的行。索引
8.df.loc[m][n]
:返回索引值爲m行n列的數據。圖片
9.df.loc[m:n]
:返回索引值爲m到n的行。rem
10.df.loc[[m,n,k]]
:返回索引值分別爲m,n,k的行。
11.df["str"]
:返回列名爲str的這一列。
12.df.columns.tolist()
:將列名作成列表。
13.df["str"]*df["str"]
:兩列維度相同,則兩列的對應位置相乘。
14.df.sort_values("str",inplace=True,ascending=False)
:將str一列按照降序排列,且獲得的數據替換原數據。inplace表示是否用排序後的數據替代原數據,默認爲False,也就是不替換。ascending表示排序的順序,默認爲True,也就是按照升序排列。
15.judge = pd.isnull(df["str"])
:返回bool型值,str這一列的數據是空值返回True,不是空值返回False。
16.a["judge"]
:返回judge爲True,也就是缺失的數據,這時再調用len()
函數便可求得缺失數據的個數。
17.df.pivot_table(index="a",values="b",aggfunc=np.mean)
:這是一個很重要的函數,將b求平均值,按照a的類別進行分類,第三個參數默認爲求平均值。
18.df.loc[n,"str"]
:定位到第n行,列名爲str處的數據。
19.sort_res.reset_index(drop=True)
:將排序後的數據的編號也從新排列,drop指是否丟棄原數據。運行後的結果與14的圖對比能夠發現,編號已經從新排列了。
20.df.apply()
:這是在pandas中的自定義函數的使用方法,括號中傳入函數名。