Hive實踐分享之存儲和壓縮的坑

大家都知道,由於集羣資源有限,我們一般都會針對數據文件的「存儲結構」和「壓縮形式」進行配置優化。在我實際查看以後,發現集羣的文件存儲格式爲Parquet,一種列式存儲引擎,類似的還有ORC。而文件的壓縮形式爲Snappy。具體的操作形式如下: ① 創建Parquet結構的表(Hive 0.13 and later): CREATE TABLE CRM.DEMO(A INT) STORED AS P
相關文章
相關標籤/搜索