IV WOE & 評分卡 & 分箱

  數據分箱:對連續變量離散化;實際上就是按照屬性值劃分的子區間,可以簡單理解爲分段處理(不同的是對特徵進行分箱後,需要對分箱的每組進行woe編碼進行分箱評估,才能放進模型訓練); 意義:     1.模型更穩定,特徵離散化後,起到簡化邏輯迴歸模型的作用,降低過擬合風險;     2.變量離散化後對異常數據有很強的魯棒性;     3.將邏輯迴歸模型轉換爲評分卡形式的時候,分箱也是必須的; 分組原
相關文章
相關標籤/搜索