【數據湖計算篇】雲原生計算引擎挑戰與解決方案

雲原生背景介紹與思考 圖一是基於ECS底座的EMR架構,這是一套非常完整的開源大數據生態,也是近10年來每個數字化企業必不可少的開源大數據解決方案。主要分爲以下幾層: ECS物理資源層,也就是Iaas層 數據接入層,例如實時的Kafka,離線的Sqoop 存儲層,包括HDFS和OSS,以及EMR自研的緩存加速JindoFS 計算引擎層,包括熟知的Spark,Presto、Flink等這些計算引擎
相關文章
相關標籤/搜索