阿里云云原生數據湖體系全解讀——數據湖存儲JindoDistCp 數據導入

數據湖就像是一個「 大水池」 , 是一種把各類異構數據進行集中存儲的架構。 數據湖是一種存儲架構, 在阿里雲上可以利用 OSS 對象存儲, 來當數據湖的地基。 企業基於阿里雲服務, 可以快速挖出一個適合自己的"湖", 而且這個"湖"根據需求, 可大可小, 按"注水量"付費。 在挖好這個"湖"後, 重要的步驟就是如何把各種異構數據注入到湖裏。 在傳統的大數據領域用戶經常使用 HDFS 作爲異構數據的
相關文章
相關標籤/搜索