數據挖掘(一):引論

數據挖掘又稱從數據中挖掘知識知識提取數據/模式分析、數據考古和數據捕撈數據庫

1. 爲何進行數據挖掘?

日益增加的數據同其中能獲得的知識量的矛盾。數據愈來愈多,就迫切須要從數據中提取信息的工具。簡單講就是從數據中挖掘知識工具

2. 什麼是數據挖掘?

數據挖掘就是從數據中發現知識的過程。
知識發現過程由如下步驟的迭代序列組成:spa

  • 1.數據清理(消除噪聲和刪除不一致數據)
  • 2.數據集成(多種數據源能夠組合在一塊兒)
  • 3.數據選擇(從數據庫中提取和分析任務相關的數據)
  • 4.數據變換(經過彙總或彙集操做,把數據變換和統一成適合挖掘的形式)
  • 5.數據挖掘(基本步驟,使用智能化方法提取數據模式)
  • 6.模式評估(根據某種興趣度度量,識別表明知識的真正有趣的模式)
  • 7.知識表示(使用可視化和知識表示技術,向用戶提供數據挖掘的知識)

廣義的數據挖掘的觀點:
數據挖掘是從大量數據中挖掘有趣模式和知識的過程。3d

3. 能夠挖掘什麼類型的模式?

數據挖掘任務能夠分爲兩類:
1.描述性:描述性挖掘任務刻畫目標數據中數據的通常性質
2.預測性:預測性挖掘任務在當前數據上進行概括,以便作出預測code

clipboard.png

4. 使用什麼技術?

clipboard.png

5. 數據挖掘的主要問題

  • 挖掘方法
  • 用戶交互
  • 有效性與伸縮性
  • 數據類型的多樣性
  • 數據挖掘與社會
相關文章
相關標籤/搜索