HIVE SQL優化的兩個思路

上一篇我們介紹了關係型數據庫SQL的優化主要是索引和減少數據量,本文以大家常用的HIVE SQL爲基礎來介紹如何優化SQL的運行速度。 下面是本次分享的邏輯和順序:   HIVE SQL優化的核心   數據傾斜 大家知道大數據的核心之一就是數據量大,所以數據量很大對於大數據本身不是挑戰,否則就不叫大數據了。大數據最怕的就是數據傾斜,所謂的傾斜就是所有的task都放到一個節點(暫且理解爲一臺機器)去
相關文章
相關標籤/搜索