HTAP數據庫系列 | 數據湖時代的數據庫如何選擇?

Pentaho的CTO James Dixon在2010年創造了「數據湖」這個術語,並將其定義如下:「如果你把數據集市看作一個瓶裝水的儲存——清潔、包裝和結構化以便於消費。將這個術語的數據版本和數據湖流的內容從源頭轉換爲填充湖泊,並且該湖的各種用戶可以前來檢查、潛水或取樣。」 《福布斯》雜誌將數據湖與數據倉庫相比定義爲:「數據湖與數據倉庫的區別在於數據倉庫中的數據在輸入點被預先分類,這可以決定如何
相關文章
相關標籤/搜索