數據湖的最佳實踐

數據湖(Data Lake)概念最早是2011年由CITO Research網站的CTO和作家Dan Woods所提出,並且時至今日依然伴隨着不少的爭議。「數據湖」的百度百科詞條創建於15年的10月份,在國內網絡上的資料也僅僅是從2014年底纔開始大規模集中出現,在國內,它還是一個相對年輕的概念。 根據定義,「數據湖是指一個大型的基於對象的存儲庫,以數據的原始格式保存數據,直到它需要被使用時。」
相關文章
相關標籤/搜索