hive的strict模式下where,group by,having,order by同時使用的執行順序

主要限制三種狀況spa (1) 有partition的表查詢須要加上where子句,篩選部分數據實現分區裁剪,即不容許全表全分區掃描,防止數據過大排序 (2) order by 執行時只產生一個reduce,必須加上limit限制結果的條數,防止數據量過大形成1個reduce超負荷it (3) join時,若是隻有一個reduce,則不支持笛卡爾積查詢。也就是說必需要有on語句的關聯條件,作天然鏈
相關文章
相關標籤/搜索