Hive中join的三種方式

              hive在實際的應用過程中,大部份分情況都會涉及到不同的表格的連接,例如在進行兩個table的join的時候,利用MR的思想會消耗大量的內存,良妃磁盤的IO,大幅度的影響性能,因爲shuffle真的好令人擔心啊,總之,就是各種問題都是由他產生的。下面介紹一下涉及hive在join的時候的優化方式 第一:在map端產生join          mapJoin的主要意思就
相關文章
相關標籤/搜索