Hive動態分區&Partition中跟函數

1、前段時間由於導表需求(從一張表中查找出數據,按日期分區overwrite 到指定分區表中),在Hive裏面研究了一下自動分區。node

步驟:sql

         一、建好所需分區表函數

         二、設置分區參數spa

set hive.exec.dynamic.partition=true;(可經過這個語句查看:set hive.exec.dynamic.partition;) 
set hive.exec.dynamic.partition.mode=nonstrict; 
SET hive.exec.max.dynamic.partitions=100000;(若是自動分區數大於這個參數,將會報錯)
SET hive.exec.max.dynamic.partitions.pernode=100000;

         3、書寫代碼(特別注意:日期字段必定要放在末尾),例如:code

INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt)
select id        
       ,...
       ,pv
       ,0  uv
       ,cal_dt
from   dw_stage.tiny_info_msg


2、若是要在partition字段用函數處理也可經過經過這種方式實現;例如:it

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nostrick;
INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt)
SELECT id    
       ,...
       ,pv
       ,date_sub('2014-03-23',7) cal_dt
FROM   dw_stage.tiny_info_msg07;
相關文章
相關標籤/搜索