一文介紹特徵工程裏的卡方分箱,附代碼實現

初次接觸變量分箱是在做評分卡模型的時候,SAS軟件裏有一段宏可以直接進行連續變量的最優分箱,但如果搬到Python的話,又如何實現同樣或者說類似的操作呢,今天就在這裏簡單介紹一個辦法——卡方分箱算法。 爲了讓大家更好理解這個算法,我先從基礎的原理開始講起。 一、什麼是卡方分佈 卡方分佈(chi-square distribution, χ2-distribution)是概率統計裏常用的一種概率分佈
相關文章
相關標籤/搜索