智能運維大數據處理時發生數據傾斜的解決方案

爲何會發生數據傾斜? 19世紀末意大利經濟學家帕累託發現在任何一組東西中,最重要的只佔其中一小部分,約20%,其餘80%儘管是多數,卻是次要的,因此又稱二八定律,又叫帕累托法則。 因此,正常的數據分佈理論上來說都是會發生傾斜的,例如,在進行運維大數據分析時,80%的故障異常都是由20%的常見運維問題導致的,因此,會導致少數的問題有非常多的記錄。 數據傾斜產生原因: MapReduce模型中,數據傾
相關文章
相關標籤/搜索