大數據面試題——Hive面試題總結(一)

1、Hive表關聯查詢,如何解決數據傾斜的問題?(☆☆☆☆☆)     1)傾斜原因: map輸出數據按key Hash的分配到reduce中,由於key分佈不均勻、業務數據本身的特、建表時考慮不周、等原因造成的reduce 上的數據量差異過大。          (1)key分佈不均勻;          (2)業務數據本身的特性;          (3)建表時考慮不周;          (
相關文章
相關標籤/搜索