3.4 數據預處理(一) - 數據集成(Data Integration)

簡介 數據集成(Data Integration)是一個數據整合的過程。通過綜合各數據源,將擁有不同結構、不同屬性的數據整合歸納在一起,就是數據集成。由於不同的數據源定義屬性時命名規則不同,存入的數據格式、取值方式、單位都會有不同。因此即便兩個值代表的業務意義相同,也不代表存在數據庫中的值就是相同的。因此需要數據入庫前進行集成,去冗餘,保證數據質量。 一句話解釋版本: 數據集成是將不同來源的數據整
相關文章
相關標籤/搜索