hive mapjoin使用

今天遇到一個hive的問題,以下hive sql: sql select f.a,f.b from A t join B f  on ( f.a=t.a and f.ftime=20110802)  spa 該語句中B表有30億行記錄,A表只有100行記錄,並且B表中數據傾斜特別嚴重,有一個key上有15億行記錄,在運行過程當中特別的慢,並且在reduece的過程當中遇有內存不夠而報錯。orm 爲
相關文章
相關標籤/搜索