一套數據,多種引擎續---兩種數據格式(Parquet/ORCfile)淺析

最近主要在研究大數典型應用adhoc query,要實現秒級的adhoc query,通常有3種思路: 1、用搜索技術,將查詢都建立索引,然後用搜索技術來實現。這種技術目前主要限制是索引建立和存儲成本高,索引建立不及時,例如支付寶的higo。 2、實時計算,對不能指定維度的查詢,理論上認爲是實時計算,每個列上建立函數索引,這種典型的代表是mesa。關於mesa,前面我有篇簡單的介紹性文章《mesa
相關文章
相關標籤/搜索