Hive性能優化

架構層面優化: l  分表node l  合理利用中間結果集,避免查過就丟的資源浪費,減低Hadoop的IO負載sql l  經常使用複雜或低效函數儘可能不用或拆分紅其餘實現方式,如count(distinct)apache l  合理設計表分區,靜態分區和動態分區緩存 l  優化時必定要把握總體,單個做業最優不如整個做業最優。網絡 l  文件存儲格式和壓縮方式session l  Hadoop自
相關文章
相關標籤/搜索