面向高維和不平衡數據分類的集成學習研究論文研讀筆記

高維不平衡數據的特徵(屬性)較多,類標號中的類別分佈不均勻的數據。  高維數據分類難本質問題: 1.密度估計難問題; 2.維數災難:特徵數增加意味着分類所需的樣本數量的增加; 3.Hughes問題:給出了一個廣義上的數據測量複雜度,訓練樣本數量和分類精度三者間的關係即對有限樣本而言,存在一個最優的數據複雜度,可使分類精度達到最優。若數據特徵數很多,量過精度過高,都會導致分類精度下降。 分類中的數據
相關文章
相關標籤/搜索