平安極客挑戰賽總結(極度不平衡樣本預測總結)

首先還是要感謝平安的這次比賽,讓自己對數據處理有了更深層次的一些瞭解。 話不多說,進入正題。最優成績爲0.2878. 主要比賽流程(結合自身經驗總結) 1.基本數據的分析EDA以及隨機森林或者Xgboost方法進行對應主要特徵的提取。(紅色部分是參賽心得) 2.在對有序多值特徵時,需要結合實際問題來對具體參數進行map賦值處理,對於多值無序的特徵需要進行獨熱編碼處理(one-hot編碼),這樣不僅
相關文章
相關標籤/搜索