在分類中處理訓練集中類別不平衡問題

1.擴大數據集html     當遇到類別不均衡問題時,首先應該想到,是否可能再增長數據(必定要有小類樣本數據),更多的數據每每打敗更好的算法。由於機器學習是使用現有的數據多整個數據的分佈進行估計,所以更多的數據每每可以獲得更多的分佈信息,以及更好分佈估計。即便再增長小類樣本數據時,又增長了大類樣本數據,也可使用放棄一部分大類數據(即對大類數據進行欠採樣)來解決。 git 2.嘗試其餘分類指標gi
相關文章
相關標籤/搜索