解決真實世界問題:如何在不平衡類上使用機器學習?

如果你是機器學習課程的新手,那麼你使用過的數據庫很大程度上都是非常簡單的。其中一個原因就是,當你構建分類器時,樣本類都是平衡的——也就是說,每個類中的樣本數量是大致相同的。在教學中,數據庫通常是淨化過的,這樣老師才能夠把注意力集中在教授特定算法或技巧上,而不被其它問題干擾。一般情況下,你遇到的樣本類似下方的二維圖表,其中的點代表樣本、點的不同顏色(或形狀)代表類: 分類算法的目標是嘗試學習出一個能
相關文章
相關標籤/搜索