數據分析之Hive篇

數據分析之Hive篇 Hive基於Hadoop的數據倉庫工具支持SQL查詢功能 1、創建表 我們先創建內部表 2、Hive的複合類型數據用法:map、array、json 如何提高hive的執行效率,先將多個小文件合併 如何避免數據傾斜,使得我們提高執行效率 怎麼控制reduce數量,防止它數量過大或過小 直接控制reduce數量,500就是500個reduce
相關文章
相關標籤/搜索