CDH集羣IO測試

最近集羣在運行Hive邏輯時,監控組經常會提出服務器報警,檢測發現CDH集羣存在較大的IO瓶頸。 日誌數據IO測試,數據量134676620,邏輯:去重求總數,分組,排序。 優化思路:Hive引起的小文件問題和數據傾斜問題。 根本方案:提高服務器性能。
相關文章
相關標籤/搜索