hive筆記

set hive.cli.print.header=true;
-- 顯示字段名稱
set hive.cli.print.current.db=true;
-- 顯示當前數據庫名
drop database dbname CASCADE;
-- 刪除數據庫及庫中表
alter database dbname set dbproperties(key=value);
-- 設置數據庫元數據
alter table table_name set tblproperties('creator'='wangbin');
alter table table_name set tblproperties('EXTERNAL'='FALSE');    
-- 注意大寫的單詞外部錶轉內部表
alter table table_name set serdeproperties('field.delim'='\t');
-- 修改序列化信息
alter table table_name partition(dt='') set fileformat sequencefile;
-- 修改表的存儲屬性
alter table table_name partition(dt='') set location 'hdfs://...';
-- 修改表存儲位置
insert overwrite directory 'hdfs://...' select  *  from table_name;
-- 將查詢數據導入到一個hdfs目錄
order by 
--全局排序
sort by 
--局部(每一個reducer)排序
distribute by + 字段 
--控制相同字段的map輸出會發到一個reduce
cluster by 
--等價於distribute by +sort by 
left semi join 
-- 左半鏈接,只返回左表中符合on條件的數據
相關文章
相關標籤/搜索