數據湖詳解

什麼是數據湖? 維基上對它的解釋:數據湖(Data Lake)是一個以原始格式存儲數據的存儲庫或系統。它按原樣存儲數據,而無需事先對數據進行結構化處理。一個數據湖可以存儲結構化數據(如關係型數據庫中的表),半結構化數據(如CSV、日誌、XML、JSON),非結構化數據(如電子郵件、文檔、PDF)和二進制數據(如圖形、音頻、視頻)。 數據湖的由來? 數據湖最早是由Pentaho的創始人兼CTO, J
相關文章
相關標籤/搜索