數據分析師應該瞭解的數據湖

數據湖 數據湖是一個集中式存儲庫,允許您以任意規模存儲所有結構化和非結構化數據。您可以按原樣存儲數據(無需先對數據進行結構化處理),並運行不同類型的分析 – 從控制面板和可視化到大數據處理、實時分析和機器學習,以指導做出更好的決策。 這是AWS給出的解釋。 看了很多數據湖的介紹文章,筆者認爲數據胡和我們常說的ODS數據很類似,也就是原始數據的保存區域,存儲來自各業務系統(消息隊列)的原始數據。比如
相關文章
相關標籤/搜索