決策樹之五:連續變量計算過程

下面舉例說明如何劃分,給定數據集如下(數據集來自周志華《機器學習》) 可複製數據集在如下評論第一條! 對連續屬性的處理如下: 1.      對特徵的取值進行升序排序 給定訓練集D和連續屬性a,假定a在D上出現了n個不同的取值,先把這些值從小到大排序 因此對於數據集中的屬性「密度」,決策樹開始學習時,根節點包含的17個訓練樣本在該屬性上取值均不同。我們先把「密度」這些值從小到大排序: 0.243
相關文章
相關標籤/搜索