Druid原理分析之「批」任務數據流轉過程

本文以HDFS中的數據作爲數據源,描述Druid中對批數據的處理流程: 向Druid中提交批數據處理請求。Druid中的批處理任務會從HDFS中獲取原數據。 批任務會根據處理請求生成segment,並將生成的segments存到Deep Storage(HDFS)中。 將生成的segment的元數據信息保存到元數據存儲DB(如MySQL) Coordinator會定時從元數據存儲DB中查新生成的s
相關文章
相關標籤/搜索