【機器學習】摘記-1

1:機器學習的大框架 2:決策樹熵的計算和信息增益 決策樹核心:每回合都是最大信息增益,直到S爲0。 其他指標衡量分割好壞:基尼不確定性,錯分率。 決策樹分類常見問題及評價指標 數據屬性問題 常見離散屬性: 二元屬性,標稱屬性,適合決策樹分類算法。 數值型等連續型屬性: 如年齡,身高,血壓,在進行分類時採用連續屬性離散化,即分段分區間的形式,才能很好的適應決策樹算法。 過擬合問題 兩種誤差定義 訓
相關文章
相關標籤/搜索