如何解決機器學習中 數據不平衡 的問題

這幾年來,機器學習和數據挖掘非常火熱,它們逐漸爲世界帶來實際價值。與此同時,越來越多的機器學習算法從學術界走向工業界,而在這個過程中會有很多困難。數據不平衡問題雖然不是最難的,但絕對是最重要的問題之一。   目錄 一、數據不平衡 以二分類爲例: 二、如何解決 1. 採樣 上採樣 小衆類 下采樣 大衆類 2. 數據合成 SMOTE:利用小衆樣本在特徵空間的相似性來生成新樣本​ Borderline-
相關文章
相關標籤/搜索