使用Python構建決策樹

一、信息增益python     劃分數據集的大原則是:將無序的數據變得更加有序。在劃分數據集先後信息發生的變化稱爲信息增益,得到信息增益最高的特徵就是最好的選擇。集合信息的度量方式稱爲香農熵或者簡稱爲熵。數組     咱們採用Python計算信息熵,建立名爲trees.py的文件,此代碼的功能是計算給定數據集的熵(D)。 函數 from math import log def calcShann
相關文章
相關標籤/搜索