Python數據分析：pandas經常使用函數

時間 2019-12-10

標籤 python 數據分析 pandas 經常使用函數欄目 Python 简体版

原文原文鏈接

pandas是python中的一個數據處理庫，一樣在使用的時候咱們要先輸入import pandas as pd引入。python

1.df = pd.read_csv("文件路徑")：這是讀取csv文件的方法，若是要讀取excel或其餘文檔，都有相應的read函數。app

2.df.dtypes：若是在文件中有字符型數據返回的是object。函數

3.df.head(n)：將前n行數據顯示出來，若是不傳入參數則顯示前5行數據。spa

4.df.tail(n)：將後n行數據顯示出來，若是不傳入參數則顯示後5行數據。excel

5.df.columns：以列表的形式顯示數據表的列名。code

6.df.shape：以元組的形式顯示錶中數據的行數和列數。排序

7.df.loc[n]：返回索引值爲n的行。索引

8.df.loc[m][n]：返回索引值爲m行n列的數據。圖片

9.df.loc[m:n]：返回索引值爲m到n的行。rem

10.df.loc[[m,n,k]]：返回索引值分別爲m,n,k的行。

11.df["str"]：返回列名爲str的這一列。

12.df.columns.tolist()：將列名作成列表。

13.df["str"]*df["str"]：兩列維度相同，則兩列的對應位置相乘。

14.df.sort_values("str",inplace=True,ascending=False)：將str一列按照降序排列，且獲得的數據替換原數據。inplace表示是否用排序後的數據替代原數據，默認爲False，也就是不替換。ascending表示排序的順序，默認爲True，也就是按照升序排列。

15.judge = pd.isnull(df["str"])：返回bool型值，str這一列的數據是空值返回True，不是空值返回False。

16.a["judge"]：返回judge爲True，也就是缺失的數據，這時再調用len()函數便可求得缺失數據的個數。

17.df.pivot_table(index="a",values="b",aggfunc=np.mean)：這是一個很重要的函數，將b求平均值，按照a的類別進行分類，第三個參數默認爲求平均值。

18.df.loc[n,"str"]：定位到第n行，列名爲str處的數據。

19.sort_res.reset_index(drop=True)：將排序後的數據的編號也從新排列，drop指是否丟棄原數據。運行後的結果與14的圖對比能夠發現，編號已經從新排列了。

20.df.apply()：這是在pandas中的自定義函數的使用方法，括號中傳入函數名。