阿里云云原生數據湖體系全解讀——數據湖 雲原生計算引擎

雲原生背景介紹與思考 圖是基於 ECS 底座的 EMR 架構, 這是一套非常完整的開源大數據生態, 也是近 10 年來每個數字化企業必不可少的開源大數據解決方案。 主要分爲以下幾層: ECS 物理資源層, 也就是 Iaas 層。數據接入層, 例如實時的 Kafka, 離線的 Sqoop。存儲層, 包括 HDFS 和 OSS, 以及 EMR 自研的緩存加速 JindoFS。計算引擎層, 包括熟知的
相關文章
相關標籤/搜索