《數據挖掘導論》學習筆記(一)

四種主要的數據挖掘任務:  一、預測建模任務算法   分類:用於預測離散的目標變量 迴歸:用於預測連續的目標變量  二、關聯分析函數  三、聚類分析對象  四、異常檢測文檔 主要的數據質量問題:存在噪聲和離羣點,數據遺漏、不一致或重複,數據有誤差,或者在別的方面,數據不表明描述所設想的現象或整體狀況。數據挖掘 測量標度:將數值或符號值與對象的屬性相關聯的規則(函數),一般將屬性的類型稱爲測量標度的
相關文章
相關標籤/搜索