機器學習——決策樹算法

決策樹的基本概念 決策樹算法是一類常用的機器學習算法,在分類問題中,決策樹算法通過樣本中某一維屬性的值,將樣本劃分到不同的類別中去。  選擇最佳劃分的標準   選擇劃分數據集的特徵的時候存在一定的順序,選擇的依據是這一維特徵對數據的劃分更具區分性,在決策樹算法中,通常有這些標準:信息增益、增益率和基尼係數。 熵是度量樣本集合純度最常用的一種指標,  信息增益 信息熵表示的是不確定度。均勻分佈時,不
相關文章
相關標籤/搜索