基於信息論的特徵選擇算法綜述

緒論 特徵選擇的目標是從樣本數據集的原始特徵F中尋找一個子集S,使得它包含儘量多的類區分信息,即包含更多與類別C有關的知識,同時又使得子集內部的冗餘程度儘可能小。定義信息度量函數J(f),其目的是在原始特徵集F內選擇子集S,保證其與類別C之間相關性程度最大,同時又保證子集S內部的冗餘性最小。算法 爲了方便起見,下面先對幾個經常使用的符號作一簡單約定:符號F和S分別表示未選的和已選的特徵子集,C表示
相關文章
相關標籤/搜索