【大數據面試題】(一)Hadoop 相關面試題總結

1.MapTask並行機度是由什麼決定的? 由切片數量決定的。 2.MR是幹什麼的? MR將用戶編寫的業務邏輯代碼和自帶的默認組件結合起來組成一個完整的分佈式應用程序放到hadoop集羣上運行。 3.combiner和partition的作用: combiner的意義就是對每一個maptask的輸出進行局部彙總,以減小網絡傳輸量  partition的默認實現是hashpartition,是map
相關文章
相關標籤/搜索