Hive與hadoop的面試知識點

一.hive中sort by、order by、distribute by、Cluster by表明什麼意思? 一、order by 會對輸入作全局排序,所以只有一個 reducer,會致使當輸入規模較大時, 須要較長的計算時間。 二、sort by 不是全局排序,其在數據進入 reducer 前完成排序。所以,若是用 sort by 進行排序,而且設置 mapred.reduce.tasks>1
相關文章
相關標籤/搜索