本文參考自:pandas 修改 DataFrame 列名
原博客針對每一個DataFrame.columns
中的元素作相同的修改操做
而拙做是對每一個元素作不一樣操做的生搬硬套, 請你們不吝賜教html
存在一個名爲dataset
的DataFrame
app
>>> dataset.columns Index(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan', 'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays', 'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx', 'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'], dtype='object')
如今, 我要將其columns
名字改成:函數
>>> new_columns Index(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5', 'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10', 'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14', 'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17', 'euribor3m_18', 'nr.employed_19', 'y_20'], dtype='object')
DataFrame.columns
類的自身屬性修改:>>> # 先解決`new_columns`的推導問題 >>> # 列表推導 >>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)] >>> # 類型轉換 >>> new_columns = pd.core.indexes.base.Index(new_columns_list) >>> dataset.columns = new_columns
.map(mapper, na_action=None)
函數來修改>>> # 注:mapper 多運用 lambda 表達式 >>> # 但我彷佛沒有找到在 lambda 表達式中改變兩個值的方法 >>> # 因此只能蹩腳地用一個全局變量i, 和映射函數mapper() >>> # 但願你們能幫我找到方法 >>> i = 0 >>> def mapper(x): # 映射函數即 mapper global i x += '_' + str(i) i += 1 return x >>> dataset.columns.map(mapper)
DataFrame.columns.str
對象用help(DataFrame.columns.str)
翻遍了文檔,
也沒能找到能夠被我拿來套用的方法, 想着抽時間把這段文檔翻譯一下翻譯
DataFrame.rename()
函數來修改>>> # 此處先用字典推導法 >>> new_dict = { key:key+'_'+str(i) for i, key in enumerate(dataset.columns) } >>> dataset.rename(columns=new_dict, inplace=True)
>>> # 原博文依然用到了 lambda 表達式 >>> # 我就再生搬硬套一次, 把上面的複製過來 >>> # 蹩腳地用一個全局變量i, 和映射函數mapper() >>> i = 0 >>> def mapper(x): # 映射函數即 mapper global i x += '_' + str(i) i += 1 return x dataset.rename(columns=mapper, inplace=True)