hive簡單查詢優化總結

          hive作爲hadoop系列的計算模型,在公司的數據清洗和報表開發廣泛使用,合理的優化自己的語句結構可以節省計算時間,優化集羣的計算資源,下面總結下日常工作中自己碰到的一些問題和別人總結的一些方法。 優化的策略 我們先了解下關係型數據庫sql的執行順序,hive大致相同 具體策略: 1、儘早的過濾數據,hive同樣會先執行join,再執行where,分區表要加分區,同時只選擇需
相關文章
相關標籤/搜索