Hive面試題考點-整理

1)Hive數據傾斜問題:mysql 傾斜緣由: map輸出數據按Key Hash分配到reduce中,因爲key分佈不均勻、或者業務數據自己的特色。等緣由形成的reduce上的數據量差別過大。sql 1.1)key分佈不均勻apache 1.2)業務數據自己的特性數組 1.3)SQL語句形成數據傾斜負載均衡 解決方案:函數 1>參數調節:oop     hive.map.aggr=truecod
相關文章
相關標籤/搜索