一套數據,多種引擎續---兩種數據格式(Parquet/ORCfile)淺析

最近主要在研究大數典型應用adhoc query,要實現秒級的adhoc query,一般有3種思路:算法 一、用搜索技術,將查詢都創建索引,而後用搜索技術來實現。這種技術目前主要限制是索引創建和存儲成本高,索引創建不及時,例如支付寶的higo。數據庫 2、實時計算,對不能指定維度的查詢,理論上認爲是實時計算,每一個列上創建函數索引,這種典型的表明是mesa。關於mesa,前面我有篇簡單的介紹性文
相關文章
相關標籤/搜索