大數據技術Hive中parquet和SEQUENCEFILE區別 (第一篇)

概述 目錄 概述 1. hive文件存儲格式包括以下幾類: 一、TEXTFILE 二、SEQUENCEFILE 三、RCFile文件格式 概述歷史 RCFile使用 基於行存儲的優點和缺點 基於列存儲的優點和缺點 源碼分析 1. Writer 2. append RCFile的索引機制 flushRecords的具體邏輯 RCFile的Sync機制 RCFileclose過程 數據讀取和Lazy解
相關文章
相關標籤/搜索