Presto ORC及其性能優化

簡介 ORC的全稱是(Optimized Row Columnar),其是爲了加速Hive查詢以及節省Hadoop磁盤空間而生的,其使用列式存儲,支持多種文件壓縮方式。由於其被廣泛應用在Hadoop系統中,Presto 0.77版本在Hive Connector裏實現了ORC Reader。 ORC文件結構 上圖(圖1)來自網絡,有很多文章通過這張圖片介紹了ORC文件結構,我這裏就不多囉嗦了,我們
相關文章
相關標籤/搜索