oc與iloc函數
- loc函數
import pandas as pd import numpy # 導入數據 df = pd.read_csv(filepath_or_buffer="D://movie.csv") df_new = df.set_index(["country"]) df_new.loc[list(["Canada"])] # 1 df_new.loc[df_new["duration"]>160] # 2 df_new.loc[((df_new["duration"] > 200) & (df_new["director_facebook_likes"] > 300 )),"flage"] =1 # 3 df_new.loc[df_new["duration"].isin([100])] # 4 df_new.query("duration > 100 & index == 'UK'") # 5
1:根據列中的元素,選取對應元素的數據集
2:根據元素的選取條件來選取對應的數據集
3:根據元素的選取條件來來選取對應的數據集,並在符合條件的數據行添加flage標籤
4:isin函數是series用來判斷值是否在目標值是否在series
5:query函數中用來判斷條件符合的數據集並返回python
- iloc函數
df_new.iloc[0:4]
iloc比較簡單,它是基於索引位來選取數據集,0:4就是選取 0,1,2,3這四行,須要注意的是這裏是前閉後開集合函數
使用標籤選取數據:spa
-
df.loc[行標籤,列標籤]
-
df.loc['a':'b']#選取ab兩行數據
-
df.loc[:,'one']#選取one列的數據
df.loc的第一個參數是行標籤,第二個參數爲列標籤(可選參數,默認爲全部列標籤),兩個參數既能夠是列表也能夠是單個字符,若是兩個參數都爲列表則返回的是DataFrame,不然,則爲Series。code