開發中關於mapreduce中參數的調優策略

       使用hadoop進行大數據運算,當數據量及其大時,那麼對MapReduce性能的調優重要性不言而喻。尤爲是Shuffle過程當中的參數配置對做業的總執行時間影響特別大。下面基於官網和工做中的狀況總結和相關的調優策略。node      1.關於map端的調優屬性   apache 屬性名稱 類型 默認值 說明 mapreduce.task.io.sort.mb int  100 配置
相關文章
相關標籤/搜索