常見機器學習模型(二)——決策樹與隨機森林

決策樹與隨機森林並不能算得上是一種模型,它只能說是一種方法。常見的決策樹算法有C4.5、ID3和CART。先來看一些預備知識。 信息、熵、信息增益、基尼係數 信息 通信領域的里程碑式的人物香農提出:信息是用來消除隨機不確定性的東西。這句話你可以倒過來理解:用來消除隨機不確定性的東西才叫信息,否則你說一個確定的東西就不叫信息了。 對於機器學習中的決策樹而言,如果待分類的事物集合可以劃分爲多個類別當中
相關文章
相關標籤/搜索