開發中關於mapreduce中參數的調優策略

時間 2019-12-05

原文原文鏈接

使用hadoop進行大數據運算，當數據量及其大時，那麼對MapReduce性能的調優重要性不言而喻。尤爲是Shuffle過程當中的參數配置對做業的總執行時間影響特別大。下面基於官網和工做中的狀況總結和相關的調優策略。node 1.關於map端的調優屬性 apache 屬性名稱類型默認值說明 mapreduce.task.io.sort.mb int 100 配置

>>阅读原文<<