MapReduce之mapper任務執行流程詳解

        第一階段是把輸入目錄下文件按照必定的標準逐個進行邏輯切片,造成切片規劃。默認狀況下,Split size = Block size。每個切片由一個MapTask 處理。(getSplits) 第二階段是對切片中的數據按照必定的規則解析成<key,value>對。默認規則是把每一行文本內容解析成鍵值對。key 是每一行的起始位置(單位是字節),value 是本行的文本內容。(Text
相關文章
相關標籤/搜索