這個面試問題很難麼 | 如何處理大數據中的數據傾斜

數據傾斜 數據傾斜是我們在處理大數據量問題時繞不過去的問題,也是在面試中幾乎必問的考點。 正常的數據分佈理論上都是傾斜的,就是我們所說的'二八原理':80%的財富集中在20%的人手中, 80%的用戶只使用20%的功能 , 20%的用戶貢獻了80%的訪問量。 簡單來說數據傾斜就是數據的key 的分化嚴重不均,造成一部分數據很多,一部分數據很少的局面。 表現 相信大部分做數據的童鞋們都會遇到數據傾斜,
相關文章
相關標籤/搜索