乾貨整理:處理不平衡數據的技巧總結!收好不謝

文:Rick Radewagen 譯:李萌 在銀行欺詐檢測,市場實時競價或網絡入侵檢測等領域通常是什麼樣的數據集呢? 在這些領域使用的數據通常有不到1%少量但「有趣的」事件,例如欺詐者利用信用卡,用戶點擊廣告或者損壞的服務器掃描網絡。  然而,大多數機器學習算法對於不平衡數據集的處理不是很好。 以下七種技術可以幫你訓練分類器來檢測異常類。 1.使用正確的評估指標  對使用不平衡數據生成的模型應用不
相關文章
相關標籤/搜索