hadoop相關試題總結

1.MapTask並行機度是由什麼決定的?java 由切片數量決定的。node 3.combiner和partition的做用:linux combiner的意義就是對每個maptask的輸出進行局部彙總,以減少網絡傳輸量  partition的默認實現是hashpartition,是map端將數據按照reduce個數取餘,進行分區,不一樣的reduce來copy本身的數據。 partition的
相關文章
相關標籤/搜索