申請評分卡模型數據預處理(二)

變量篩選 用戶的屬性有千千萬萬個維度,而評分卡模型所選用的字段在30個以下,那麼怎樣挑選這些字段呢? 挑選入模變量需要考慮很多因素,比如:變量的預測能力,變量之間的線性相關性,變量的簡單性(容易生成和使用),變量的強壯性(不容易被繞過),變量在業務上的可解釋性(被挑戰時可以解釋的通)等等。 其中最主要和最直接的衡量標準是變量的預測能力和變量的線性相關性。 本文主要探討基於變量預測能力的單變量篩選,
相關文章
相關標籤/搜索