hive hql語句高級用法

一,order by ,sort by,distribute by 的用法 1)order by 對全局數據的一個排序,僅僅只有一個reduce工做,最好不用。node 2)sort by  對每個reduce 內部數據進行排序,全局結果集來講不是排序。  set mapreduce.job.reuces = 3 ;  會生成3個文件,每一個文件內都是排好序的。算法 3)distribute by
相關文章
相關標籤/搜索