一篇文章掌握 delta、iceberg 和 hudi 三大開源數據湖方案

目前市面上流行的三大開源數據湖方案分別爲:delta、Apache Iceberg和Apache Hudi。其中,因爲Apache Spark在商業化上取得巨大成功,因此由其背後商業公司Databricks推出的delta也顯得格外亮眼。Apache Hudi是由Uber的工程師爲知足其內部數據分析的需求而設計的數據湖項目,它提供的fast upsert/delete以及compaction等功能
相關文章
相關標籤/搜索