Hive數據導入方案—使用ORC格式存儲hive數據

目的:將上網日誌導入到 hive中,要求速度快,壓縮高,查詢快,表易維護。推薦使用 ORC格式的表存儲數據 思路:由於在 hive指定 RCFile格式的表,不能直接 load數據,只能經過 textfile表進行 insert轉換。考慮先創建txtFile格式內部臨時表 tmp_testp,使用 hdfs fs -put命令向 tmp_testp表路徑拷貝數據(不是 load),再創建ORC格式
相關文章
相關標籤/搜索