相信有不少人收這個問題的困擾,若是你想一次性在pandas.DataFrame裏添加幾列,或者在指定的位置添加一列,都會很苦惱找不到簡便的方法;能夠用到的函數有df.reindex, pd.concathtml
咱們來看一個例子:函數
df 是一個DataFrame, 若是你只想在df的後面添加一列,能夠用下面的方法:spa
可是若是你想一次性添加兩列級以上,你可能會用通樣的辦法code
df[['D','E']] == None ,結果報錯以下:htm
因此接下來我想介紹兩種認爲比較簡便的方法對象
(1)第一個方法是利用pd.concat 在DataFrame後面添加兩列,這種方法的缺點是不能指定位置blog
pd.concat([df, pd.DataFrame(columns=list('DE'))])索引
(2)第二種方法是利用 reindex來重排和增長列名df.reindex(columns=list('ABCDE'))pandas
這種方法,你能夠改變各列的相對位置,且保留原始列的數值,好比df.reindex(columns=list('BCADE'))class
reindex 還有 fill_value 選項,能夠填充NaN,例子以下df.reindex(columns=list('ABCDE'), fill_value=0)
固然這裏舉的例子比較簡單,在實際運用中,列名可能都比較長,都敲出來確定不方便,因此咱們須要更強大的方法,運用到 list.insert的方法list.insert(index, obj)
參數
index -- 對象obj須要插入的索引位置。
obj -- 要插入列表中的對象。
先獲取原列名集合, 賦值給新變量(這個很重要,具體緣由我也不知道爲啥), 而後 insert
col_name = df.columns.tolist() col_name.insert(1,'D') df.reindex(columns=col_name) Out[92]: A D B C 01 NaNNoneNone 13 NaNNoneNone 或者不用數字索引,直接在某列前面或後面插入,利用 list.index的方法 col_name = df.columns.tolist() col_name.insert(col_name.index('B'),'D')# 在 B 列前面插入 df.reindex(columns=col_name) Out[93]: A D B C 01 NaNNoneNone 13 NaNNoneNone col_name = df.columns.tolist() col_name.insert(col_name.index('B')+1,'D') # 在 B 列後面插入 df.reindex(columns=col_name) Out[96]: A B D C 01None NaNNone 13None NaNNone
轉自:http://www.th7.cn/Program/Python/201708/1216328.shtml