數據挖掘
又稱從數據中挖掘知識
、知識提取
、數據/模式分析
、數據考古和數據捕撈數據庫
日益增加的數據同其中能獲得的知識量的矛盾。數據愈來愈多,就迫切須要從數據中提取信息的工具。簡單講就是從數據中挖掘知識
。工具
數據挖掘就是從數據中發現知識的過程。
知識發現過程由如下步驟的迭代序列組成:spa
數據清理
(消除噪聲和刪除不一致數據)數據集成
(多種數據源能夠組合在一塊兒)數據選擇
(從數據庫中提取和分析任務相關的數據)數據變換
(經過彙總或彙集操做,把數據變換和統一成適合挖掘的形式)數據挖掘
(基本步驟,使用智能化方法提取數據模式)模式評估
(根據某種興趣度度量,識別表明知識的真正有趣的模式)知識表示
(使用可視化和知識表示技術,向用戶提供數據挖掘的知識)廣義的數據挖掘的觀點:數據挖掘是從大量數據中挖掘有趣模式和知識的過程。
3d
數據挖掘任務能夠分爲兩類:
1.描述性
:描述性挖掘任務刻畫目標數據中數據的通常性質
2.預測性
:預測性挖掘任務在當前數據上進行概括,以便作出預測code