spark ORC原理

orc歷史   ORC的全稱是(Optimized Row Columnar),ORC文件格式是一種Hadoop生態圈中的列式存儲格式,它的產生早在2013年初,最初產生自Apache Hive,用於下降Hadoop數據存儲空間和加速Hive查詢速度。java orc結構–----hdfs上的物理視圖    orc結構----邏輯視圖 orc存儲結構解析     orc文件有以下結構快:block
相關文章
相關標籤/搜索