1.數據庫和數據管理產業在一些關鍵功能的開發上不斷髮展:數據收集和數據庫建立、數據管理(包括數據存儲和檢索、數據庫事務處理)和高級數據分析(包括數據倉庫和數據挖掘)。數據庫
2.數據倉庫:這是一種多個異構數據源在單個站點以統一的模式組織的存儲,以支持決策管理。數據倉庫技術包括數據清理、數據集成和聯機分析處理(OLAP)。安全
3.許多人把數據挖掘視爲另外一個流行術語數據中的知識發現(KDD)的同義詞,而另外一些人只是把數據挖掘視爲知識發現過程的一個基本步驟。數據結構
4.數據挖掘過程:數據清理(消除噪聲和刪除不一致數據);數據集成(多種數據源能夠組合在一塊兒);數據選擇(從數據庫中提取與分析任務相關的數據);數據變換(經過彙總或彙集操做,把數據變換和統一成適合挖掘的形式);數據挖掘(基本步驟,使用智能方法提取數據模式);模式評估(根據某種興趣度度量,識別表明知識的真正有趣的模式。);知識表示(使用可視化和知識表示技術,向用戶提供挖掘的知識)。併發
5.數據挖掘是從大量數據中挖掘有趣模式和知識的過程。分佈式
6.數據庫系統,也稱數據庫管理系統(DBMS),由一組內部相關的數據(稱作數據庫)和一組管理和存取數據的軟件程序組成。軟件程序提供以下機制:定義數據庫結構和數據存儲,說明和管理併發、共享或分佈式數據訪問,面對系統癱瘓或未受權的訪問,確保存儲的信息的一致性和安全性。spa
7.關係數據庫是表的聚集,每一個表都被賦予一個惟一的名字。每一個表都包含一組屬性(列或字段),而且一般存放大量元組(記錄或行)。關係表中的每一個元組表明一個對象,被惟一的關鍵字標識,並被一組屬性值描述。一般爲關係數據庫構建語義數據模型,如實體-聯繫(ER)數據模型。ER數據模型將數據庫表示成一組實體和它們之間的聯繫。對象
八、數據倉庫用稱做數據立方體(data cube)的多維數據結構建模。其中每一個維對應於模式中的一個或一組屬性,而每一個單元存放某種彙集度量值。數據立方體提供數據的多維視圖,並容許預計算和快速訪問彙總數據。事務
9.一個模式是有趣的,若是它:1)易於被人理解;2)在某種確信度上,對於新的或檢驗數據是有效的;3)是潛在有用的;4)是新穎的。開發
10.存在一些模式興趣度的客觀度量。這些度量基於所發現模式的結構和關於它們的統計量。對於形如X=>Y的關聯規則,一種客觀度量是規則的支持度.數據分析