Hive的Order by、Sort by、Distribute by和Cluster by的區別

在Hive中,可以像SQL一樣對數據進行全局或局部排序,這裏利用orders表來測試order by、sorty by、distribute by和cluster by的排序結果。 數據準備 orders表的字段如下:利用order_dow(其取值範圍是0-6)字段來測試 orders表的數據如下(limit 20): 在以下測試中我設置reduce數爲3,便於觀察不同排序的效果 set mapr
相關文章
相關標籤/搜索