機器學習—決策樹

決策樹算法的兩個階段 決策樹基本術語(根節點、葉子節點、內部節點) 信息熵概念和直觀理解 信息熵和基尼係數 熵:純度\不純度;不確定性 熵是用來度量不確定性,當熵越大,概率說X=xi的不確定性越大,反之越小;在機器學期中分類中說,熵越大即這個類別的不確定性更大,反之越小 基尼不純度表示一個隨機選中的樣本在子集中被分錯的可能性。 基尼不純度爲這個樣本被選中的概率乘以它被分錯的概率。 當一個節點中所有
相關文章
相關標籤/搜索