hadoop中MR的切片機制源碼分析

上篇關於job提交的源碼分析中我們將整體流程大概分析了,本篇重點分析關於其中submit提交過程中對於文件的切片機制進行討論 在JobSubmitter類中200行左右進行了文件分片的處理,進入其中 再進入主要的writeNewSplits()方法 沒有配置的情況下,默認是TextInputFormat,此時調用的是其繼承與父類FileInputFormat的getSplits()方法 其中具體獲
相關文章
相關標籤/搜索