基於Google Dataproc+Alluxio加速本地Hadoop數據湖計算處理

時間 2021-01-13

原文原文鏈接

很多公司將他們的數據存儲在私有集羣環境的Hadoop分佈式文件系統(HDFS) 中。隨着存儲數據量的增長以及來自Apache Spark, Presto, Apache Hive等分析框架之上的應用負載增加,這種固定的私有基礎架構變得更加耗費資金並且造成了數據處理作業的延時增大。處理該問題的方法之一就是使用Alluxio配合Google Dataprco加速作業負載。Alluxio是一個爲分析型任

>>阅读原文<<