最近想學習一下數據挖掘的相關知識,從網上找了本《數據挖掘:概念與技術》來看看。打算寫一些筆記,記錄一下比較基礎又重要的知識點。但願本身能把基礎打牢一點,也但願能幫到一些跟我同樣打算入門的小白。數據庫
一、數據挖掘能夠看作信息技術天然進化的結果,它是基於數據庫和數據管理產業不斷髮展的產物。學習
二、什麼是數據挖掘? 通俗來講數據挖掘就是從大量數據中挖掘有趣模式和知識的過程。它是咱們從大型數據集中提煉知識的一項基本步驟,所有步驟爲:數據清洗(消除噪聲和刪除不一致數據)、數據集成(多種數據源能夠組合在一塊兒)、數據選擇(從數據庫中提取與分析任務相關的數據)、數據變換(經過彙總或彙集操做,把數據變換和統一成適合挖掘的形式)、數據挖掘(使用智能方式提取數據模式)、模式評估(根據某種興趣度度量,識別表明知識的真正有趣的模式)、知識表示(使用可視化和知識表示技術,向用戶提供挖掘的知識)。繼承
三、數據庫和數據倉庫的區別 關係數據庫是表的聚集,每一個表中的數據都是高度結構化的結果,每條數據都由多個相同類型屬性構成,所以使用起來能夠十分方便的抓住數據的主要特徵(是數據挖掘研究的一種主要數據形式)。數據倉庫是一個從多個數據源收集的信息存儲庫,存放在一致的模式下,而且一般駐留在單個站點上。數據倉庫經過數據清洗、變換、繼承、裝入和按期數據刷新來構造。數據挖掘
四、數據挖掘功能有哪些 存在大量數據挖掘功能,包括特徵化與區分、頻繁模式、關聯和相關性挖掘、分類與迴歸、聚類分析、離羣點分析等。數據挖掘功能用於指定數據挖掘任務發現的模式。通常而言,這些任務能夠分爲兩類:描述性和預測性。描述性挖掘任務刻畫目標數據中數據的通常性質。預測性挖掘任務在當前數據上進行概括,以便作出預測。 ------------------困了 明天繼續---------------------入門