《數據倉庫與數據挖掘教程》ch02數據倉庫原理 章節整理

數據倉庫原理 多數據源問題 多數據源 數據倉庫和數據挖掘的數據通常來自多種數據庫或計算機應用系統或數據文件、web頁面 多數據源在集成的問題 數據不一致:數據的不一致性主要指數據之間的矛盾性和不相容性。如職務升遷了,但工資數據卻沒有改變 屬性差異:性別屬性有的取「男」/「女」,長度爲2;有的取「1」/「0」,長度爲1 數據重複:數據源中存在兩條或多條完全相同的記錄,或者同一個數據冗餘地存在於多個數
相關文章
相關標籤/搜索