weka中對數值型數據離散化

連續數值離散化大體可分爲:1)有監督(supervised)和2)無監督(unsupervised)兩類。 有監督方法可經過設定類別相關目標函數如:分類錯誤率,熵增益等指標結合二叉樹算法對特徵空間進行劃分。這類方法的核心思想就是是每類樣本儘可能分佈在特徵空間中的不一樣子劃分中。  無監督方法因爲沒有考慮類別信息,所以其核心思想是使得每一個子劃分空間的樣本分佈儘可能均勻,具體能夠採用等間隔、等密度或
相關文章
相關標籤/搜索