spark性能調優

解決方案一:使用Hive ETL預處理數據 方案適用場景:導致數據傾斜的是Hive表。如果該Hive表中的數據本身很不均勻(比如某個key對應了100萬數據,其他key纔對應了10條數據), 而且業務場景需要頻繁使用Spark對Hive表執行某個分析操作,那麼比較適合使用這種技術方案。   方案實現思路:此時可以評估一下,是否可以通過Hive來進行數據預處理(即通過Hive ETL預先對數據按照k
相關文章
相關標籤/搜索