scikit-learn機器學習——第七章 複習題

1.什麼是信息熵?其計算公式是什麼? 信息的量化。 一條信息的信息量和它的不確定性有直接關係。一個問題不確定性越大,要搞清楚這個問題,需要了解的信息就越多,其信息熵越大。 公式: 2.什麼是信息增益? 特徵劃分數據集前後信息熵的變化值。 3.在決策樹創建過程中,用什麼辦法來選擇特徵,從而進行數據集的劃分? 選擇信息增益最大的特徵 4.決策樹如何處理連續值的特徵? 對連續數值離散化 5.除了信息增益
相關文章
相關標籤/搜索