Hadoop之MR處理數據基本流程

在啓動程序中,FileInputFormat設置數據的輸入路徑,程序處理的是該路徑中的所有文件, 1、如何處理 (1)、該路徑中有幾個文件就有幾個map任務。map任務的個數是根據文件大小和個數來確定的。 (2)、在進行map任務之前,文件中的數據被一行一行的讀,形成了K1:一行的起始位置,V1:行內容,這就是map任務被輸入的K1,V1。 (3)、行內容V1被一行一行的切割,切割的時候要將這行數
相關文章
相關標籤/搜索