機器學習——決策樹和隨機森林

決策樹:從根節點開始一步步走到葉子節點(決策),所有的數據最終都會落到葉子節點,既可以做分類也可以做迴歸 決策樹思想,實際上就是尋找最純淨的劃分方法,這個最純淨在數學上叫純度,純度通俗點理解就是目標變量要分得足夠開(y=1的和y=0的混到一起就會不純)。另一種理解是分類誤差率的一種衡量。實際決策樹算法往往用到的是,純度的另一面也即不純度,下面是不純度的公式。不純度的選取有多種方法,每種方法也就形成
相關文章
相關標籤/搜索