Apache Hudi:統一批和近實時分析的存儲和服務

一篇由三位Hudi PMC在2018年做的關於Hudi的分享,介紹了Hudi產生的背景及設計,現在看來也很有意義。 分爲產生背景、動機、設計、使用案例、demo幾個模塊講解。 Uber的行程在2018年已經達到700個城市,70個國家,200w+司機的規模。 而數據在Uber中可分爲攝取和查詢,而攝取包括從kafka、hdfs上消費數據;查詢則包括使用spark notebook的數據科學家,使用
相關文章
相關標籤/搜索