數據分析實戰45講(12) 數據集成

       數據集成就是將多個數據源合併存放在一個數據存儲中(如數據倉庫),從而方便後續的數據挖掘工作。         據統計,大數據項目中80%的工作都和數據集成有關,這裏的數據集成有更廣泛的意義,包括了數據清洗、數據抽取、數據集成和數據變換等操作。這是因爲數據挖掘前,我們需要的數據往往分佈在不同的數據源中,需要考慮字段表達是否一樣,以及屬性是否冗餘。  1.數據集成的兩種架構:ELT和ET
相關文章
相關標籤/搜索