Hive面試題1

1. hive表關聯查詢,如何解決數據傾斜的問題?sql   傾斜緣由:數據庫 map輸出數據按key Hash的分配到reduce中,因爲key分佈不均勻、業務數據自己的特、建表時考慮不周、等緣由形成的reduce 上的數據量差別過大。數組 1)、key分佈不均勻;負載均衡 2)、業務數據自己的特性;函數 3)、建表時考慮不周;工具 4)、某些SQL語句自己就有數據傾斜;oop 如何避免:對於k
相關文章
相關標籤/搜索