08 - 樣本不均衡解決方案

背景 在進行數據分析的時候,有時候會存在這樣的情況:例如判斷信用卡是否存在欺詐的行爲,這樣的問題就是一個二分類的問題,但是對於這樣的問題,存在欺詐和正常的樣本是存在有很大的差距的,可能欺詐的僅僅佔有百分之一都不到;對於這樣的樣本不均衡的情況,一般情況下可以採用兩種方式進行處理:過採樣、下采樣 下采樣 對於這種方式,通常情況下就是將樣本數量多的那一方的數據量調小,使和較小樣本數量一樣的數量(使樣本數
相關文章
相關標籤/搜索