春日遊湖不易,但居家聊聊數據湖還是可以的……

其實「數據湖」的概念由來已久,如果追溯時間大概可以到2011年。 如今我們經常提及的數據湖其實可以被認爲是一個集中式的安全存儲庫,用戶可以任何規模存儲、管理、發現並共享所有結構化和非結構化數據,過程中無需預定義架構。 具體來說,從目前數據湖的實踐情況來看,集中放入其中的數據基本上可歸結爲三種類型,分別爲來自業務系統的結構化且價值較高的數據,雖然數據不大並關係複雜;日誌類的龐大體量運維數據,儘管價值
相關文章
相關標籤/搜索