order by和sort by的區別

order by實現的是全局排序,在hive mr引擎中將會只有1個reduce。而使用sort by會起多個reduce,只會在每個reduce中排序,如果不指定分組的話,跑出來的數據看起來是雜亂無章的,如果指定reduce個數是1,那麼結果和order by是一致的,如下圖,不指定的情況,兩種結果對比:               order by一般配合group by使用,而group b
相關文章
相關標籤/搜索