hive 優化

時間 2019-11-22

標籤 hive 優化欄目 Hadoop 简体版

原文原文鏈接

在 join的時候，最好是小表 + 大表，hive在連接的時候，會嘗試把前面的行，放入緩存中nginx
加入在查詢中，有一張很小的表，可使用map-side join 將小表徹底放入內存中緩存
hive> explain select * from nginx_log where p_hour='2014071211' limit 2; 使用explain 查看 hive運行的解析和計劃，查詢語句是不會執行的,explain extended 會顯示的更加詳細jvm
並行執行，limit 抽樣配置ide
合理的map 和reduce 數量，dfs-count 來判斷,jvm 重用索引
索引能夠增長 group by 的速度,動態分區內存

相關文章

相關標籤/搜索

Hive任務優化

Oracle 優化器

代碼格式化

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<