Hive 優化 (important)

Hive ive優化 要點:算法 優化時,把hive sql當作map reduce程序來讀,會有意想不到的驚喜。sql 理解hadoop的核心能力,是hive優化的根本。 長期觀察hadoop處理數據的過程,有幾個顯著的特徵: json 1.不怕數據多,就怕數據傾斜。 緩存 2.對jobs數比較多的做業運行效率相對比較低,好比即便有幾百行的表,若是屢次關聯屢次彙總,產生十幾個jobs,沒半小時是
相關文章
相關標籤/搜索