MapReduce的基礎介紹---分片,分區,合併,歸併>>shuffle過程

MapReduce的shuffle過程:這個過程就是輸入一個雜亂,毫無規則的數據。在經過MapReduce通過自定義一些規則,分片,分區,在經過合併,歸併的操作,最後讓其按照這個規則輸出來,寫入磁盤。 1.輸入分片---分片 輸入分片(inputSpilt):在進入map之前,需要經過分片,在我們不設置分片的大小時候,有兩種規則,一種就是block充滿數據,就是分片的大小一個block的大小,ha
相關文章
相關標籤/搜索