hive性能優化

數據傾斜sql 數據傾斜是指,map /reduce程序執行時,reduce節點大部分執行完畢,可是有一個或者幾個reduce節點運行很慢,致使整個程序的處理時間很長,這是由於某一個key的條數比其餘key多不少(有時是百倍或者千倍之多),這條key所在的reduce節點所處理的數據量比其餘節點就大不少,從而致使某幾個節點遲遲運行不完。apache 表現:任務進度長時間維持在99%(或100%),
相關文章
相關標籤/搜索