Map和Reduce任務的優化

編程總是圍繞着兩個問題:「如何完成這個任務」和「如何能讓程序運行得更快」 因此,相對應的MapReduce計算模型的優化也就集中在兩個方面:一是計算性能方面的優化;二是I/O操作方面的優化 1、任務調度 兩個方面的優化:一是計算方面:Hadoop總會先將任務分配給空閒的機器,使所有的任務能公平地分享系統資源;二是I/O方面:Hadoop會盡量將map任務分配給InputSplit所在的機器,以減少
相關文章
相關標籤/搜索