Logistic迴歸,類別樣本不均衡

不平衡數據的出現場景 搜索引擎的點擊預測:點擊的網頁往往佔據很小的比例 電子商務領域的商品推薦:推薦的商品被購買的比例很低 信用卡欺詐檢測 網絡攻擊識別   解決方案 從數據的角度:抽樣,從而使得不同類別的數據相對均衡 從算法的角度:考慮不同誤分類情況代價的差異性對算法進行優化   抽樣 隨機欠抽樣:從多數類中隨機選擇少量樣本再合併原有少數類樣本作爲新的訓練數據集 有放回抽樣 無放回抽樣 會造成一
相關文章
相關標籤/搜索