HIVE SQL優化的兩個思路

時間 2021-01-19

原文原文鏈接

上一篇我們介紹了關係型數據庫SQL的優化主要是索引和減少數據量，本文以大家常用的HIVE SQL爲基礎來介紹如何優化SQL的運行速度。下面是本次分享的邏輯和順序： HIVE SQL優化的核心數據傾斜大家知道大數據的核心之一就是數據量大，所以數據量很大對於大數據本身不是挑戰，否則就不叫大數據了。大數據最怕的就是數據傾斜，所謂的傾斜就是所有的task都放到一個節點（暫且理解爲一臺機器）去

>>阅读原文<<