大數據雲計算——數據傾斜原理及解決方案

數據傾斜原理及解決方案 何爲數據傾斜? 在弄清什麼是數據傾斜之前,我想讓大家看看數據分佈的概念: 正常的數據分佈理論上都是傾斜的,就是我們所說的20-80原理:80%的財富集中在20%的人手中, 80%的用戶只使用20%的功能 , 20%的用戶貢獻了80%的訪問量 ,。 不同的數據字段可能的數據傾斜一般有兩種情況: 一種是唯一值非常少,極少數值有非常多的記錄值(唯一值少於幾千) 一種是唯一值比較多
相關文章
相關標籤/搜索