Dremio數據湖引擎(一):簡介

在進入主題前,先聊下數據湖這個概念。百度百科中對該名詞有如下解釋: 數據湖或hub的概念最初是由大數據廠商提出的,表面上看,數據都是承載在基於可向外擴展的HDFS廉價存儲硬件之上的。但數據量越大,越需要各種不同種類的存儲。最終,所有的企業數據都可以被認爲是大數據,但並不是所有的企業數據都是適合存放在廉價的HDFS集羣之上的。   說白了,數據湖的意思就是將不同存儲類型、不同種類的數據匯聚在一起,例
相關文章
相關標籤/搜索