hive學習筆記之map-side joins

在分佈式計算框架中,其實錶鏈接這類操做都是須要跨節點的,因此計算效率都比較慢。hive也是如此,針對錶鏈接,hive在大表與小表進行鏈接時有個優化常用,就是map-side join。框架 好比:分佈式 select  /*+ mapjoin(u)*/  u.user_id,l.time  from user u join opera_log l on u.user_id=l.user_id wh
相關文章
相關標籤/搜索