1.按列取、按索引/行取、按特定行列取
import numpy as np from pandas import DataFrame import pandas as pd df=DataFrame(np.arange(12).reshape((3,4)),index=['one','two','thr'],columns=list('abcd')) df['a']#取a列 df[['a','b']]#取a、b列 #ix能夠用數字索引,也能夠用index和column索引 df.ix[0]#取第0行 df.ix[0:1]#取第0行 df.ix['one':'two']#取one、two行 df.ix[0:2,0]#取第0、1行,第0列 df.ix[0:1,'a']#取第0行,a列 df.ix[0:2,'a':'c']#取第0、1行,abc列 df.ix['one':'two','a':'c']#取one、two行,abc列 df.ix[0:2,0:1]#取第0、1行,第0列 df.ix[0:2,0:2]#取第0、1行,第0、1列 #loc只能經過index和columns來取,不能用數字 df.loc['one','a']#one行,a列 df.loc['one':'two','a']#one到two行,a列 df.loc['one':'two','a':'c']#one到two行,a到c列 df.loc['one':'two',['a','c']]#one到two行,ac列 #iloc只能用數字索引,不能用索引名 df.iloc[0:2]#前2行 df.iloc[0]#第0行 df.iloc[0:2,0:2]#0、1行,0、1列 df.iloc[[0,2],[1,2,3]]#第0、2行,一、二、3列 #iat取某個單值,只能數字索引 df.iat[1,1]#第1行,1列 #at取某個單值,只能index和columns索引 df.at['one','a']#one行,a列
2.按條件取行
選取等於某些值的行記錄 用 == df.loc[df[‘column_name’] == some_value] 選取某列是不是某一類型的數值 用 isin df.loc[df[‘column_name’].isin(some_values)] 多種條件的選取 用 & df.loc[(df[‘column’] == some_value) & df[‘other_column’].isin(some_values)] 選取不等於某些值的行記錄 用 != df.loc[df[‘column_name’] != some_value] isin返回一系列的數值,若是要選擇不符合這個條件的數值使用~ df.loc[~df[‘column_name’].isin(some_values)]
3.取完以後替換
df = pd.DataFrame({"id": [25,53,15,47,52,54,45,9], "sex": list('mfmfmfmf'), 'score': [1.2, 2.3, 3.4, 4.5,6.4,5.7,5.6,4.3],"name":['daisy','tony','peter','tommy','ana','david','ken','jim']})
將男性(m)替換爲1,女性(f)替換爲0html
方法1:python
df.ix[df['sex']=='f','sex']=0 df.ix[df['sex']=='m','sex']=1
注:在上面的代碼中,逗號後面的‘sex’起到固定列名的做用ide
方法2:ui
df.sex[df['sex']=='m']=1 df.sex[df['sex']=='f']=0
4.刪除特定行
# 要刪除列「score」<50的全部行: df = df.drop(df[df.score < 50].index) df.drop(df[df.score < 50].index, inplace=True) # 多條件狀況 # 能夠使用操做符: | 只需其中一個成立, & 同時成立, ~ 表示取反,它們要用括號括起來。 # 例如刪除列「score<50 和>20的全部行 df = df.drop(df[(df.score < 50) & (df.score > 20)].index)
參考文獻:url
【1】pandas 根據列的值選取全部行spa
【2】pandas小技巧之--值替換.net
【3】[譯]如何根據條件從pandas DataFrame中刪除不須要的行? - everfight - 博客園code
【4】官網htm