關於CarbonData+Spark SQL的一些應用實踐和調優

大數據時代,中大型企業數據的爆發式增加,幾乎天天都能產生約 100GB 到 10TB 的數據。而企業數據分系統構建與擴張,致使不一樣應用場景下大數據冗餘嚴重。行業亟需一個高效、統一的融合數倉,從海量數據中快速獲取有效信息,從而洞察機遇、規避風險。web 在這樣的現狀下,CarbonData 誕生了,做爲首個由中國貢獻給Apache社區的頂級開源項目,CarbonData 提供了一種新的融合數據存儲
相關文章
相關標籤/搜索