Hadoop框架之——Mapreduce工作流程

MapReduce工作原理流程簡介 在MapReduce整個過程可以概括爲以下過程: 輸入 --> map --> shuffle --> reduce -->輸出 輸入文件會被切分成多個塊,每一塊都有一個map task map階段的輸出結果會先寫到內存緩衝區,然後由緩衝區寫到磁盤上。默認的緩衝區大小是100M,溢出的百分比是0.8,也就是說當緩衝區中達到80M的時候就會往磁盤上寫。如果map計
相關文章
相關標籤/搜索