數據倉庫與數據湖

一、數據倉庫與數據湖的區別 一是存儲數據類型不同。數據倉庫中存儲的主要是結構化數據,對於加載到數據倉庫中的數據,首先需要定義數據存儲模型。而數據湖以其原生格式保存大量原始數據,包括結構化的、半結構化的和非結構化的數據,並且在使用數據之前,不對數據結構進行定義。 二是數據處理模式不同。數據倉庫是高度結構化的架構,數據在清洗轉換之後纔會加載到數據倉庫,用戶獲得的是處理後數據。而在數據湖中,數據直接加載
相關文章
相關標籤/搜索