大數據面試部分:部分面試題彙總

1. 一個數組快可以對應很多個,或者一個切片 一個split對應一個map 一個map對應一個或者n個reduce Map的輸出正好是reduce的輸入。 Shuffer:洗牌 數據向計算移動。 如何讓shuffer的效率最高。 split一條一條,以一條記錄爲依據,也就是換行符。 映射成key -value的形式。 相同的key爲一組。 面試的時候,buffer額調優,會是加分項。 有很多的機械
相關文章
相關標籤/搜索