技本功|Hive優化之監控(三)

 Hive是大數據領域常用的組件之一,主要是大數據離線數倉的運算,關於Hive的性能調優在日常工作和麪試中是經常涉及的一個點,因此掌握一些Hive調優是必不可少的技能。影響Hive效率的主要有數據傾斜、數據冗餘、job的IO以及不同底層引擎配置情況和Hive本身參數和HiveSQL的執行等因素。本文主要是從監控運維的角度對Hive進行整體性能把控,通過對hive元數據監控,提前發現Hive表的不合
相關文章
相關標籤/搜索