hive四種存儲格式介紹與分析比較

一、四種存儲格式介紹 1、TestFile  TextFile文件不支持塊壓縮,默認格式,數據不做壓縮,磁盤開銷大,數據解析開銷大。這邊不做深入介紹。 2、RCFile  Record Columnar的縮寫。是Hadoop中第一個列文件格式。能夠很好的壓縮和快速的查詢性能,但是不支持模式演進。通常 寫操作比較慢,比非列形式的文件格式需要更多的內存空間和計算量。  RCFile是一種行列存儲相結合
相關文章
相關標籤/搜索