python機器學習之決策樹

決策樹整體上就是類似於一棵充滿if-else的樹。 信息:用來消除隨機不確定性的東西。 信息熵,單位是比特,可以用來代表不確定性 策略樹一種劃分的依據是:信息增益 :知道某種特徵之後,不確定性減少的最多,就可以先看這個特徵,即這個特徵的信息增益最大 g(D,A)=H(D)-H(D/A) H(D)是信息熵,H(D/A)是條件熵,g(D,A)可以看成特徵A的信息增益。 決策樹太大,太深,會過於擬合,造
相關文章
相關標籤/搜索