python構造字典的坑

今天寫手動決策樹,一直在debug解決計算出的信息增益爲負數的問題,最終發現是這個小問題,構造字典會自動刪除重複的鍵值對。在數據集中可能出現feture:label完全相同的情況,所以導致了錯誤。 由於前兩個list的長度之和不等於第三個list的長度,我在計算劃分後的熵值的時候將len(dicList)  (以下爲sortList,是排序後的dicList) 看作樣本總數,故分母偏小,導致new
相關文章
相關標籤/搜索