機器學習實戰(3、決策樹:計算熵值、劃分數據集、得到熵值最小的特徵值)

K - 近鄰算法能夠完成不少分類任務算法 可是它最大的缺點就是沒法給出數據的內在含義app 決策樹的主要優點就在於數據形式很是容易理解 函數      一、熵:度量數據集的無序程度測試   計算數據集的香農熵:code # coding=utf-8 from math import log #計算數據集的香農熵 def calcShannonEnt(dataSet): #得到數據集的個
相關文章
相關標籤/搜索