學習筆記二:數據挖掘最佳路徑--摘自陳暘課程

一、數據挖掘的基本流程、十大算法、數學原理 A、分類算法: 1、c4.5 這個算法是得票最高的算法,可以說是十大算法之首。c4.5是決策樹的算法,它創造性地在決策樹構造過程中就進行了剪枝,並且可以處理連續的屬性,也能對不完整的數據進行處理。它可以說是決策樹分類中,具有里程碑式意義的算法。 2、樸素貝葉斯(naive bayes) 樸素貝葉斯模型是基於概率論的原理,它的思想是這樣的:對於給出的未知物
相關文章
相關標籤/搜索