決策樹詳解(三)

訓練決策樹有三個關鍵問題:算法 1.對於分類樹,大量的正常數據在其中之混雜着一個兩個的異常數據,因此分類結果極可能認爲出現的數據都是正常的。 爲了不這種狀況的出現,咱們設置先驗機率(例如根據今天的天氣,來預測明天的天氣),異常出現的狀況,咱們人爲進行增長,這樣決策樹就會被適當的增長。blog 設Qj爲設置的第j個先驗機率,Nj爲該分類的樣本數,則考慮了樣本率並進行歸一化處理的先驗機率qj爲:排序
相關文章
相關標籤/搜索