MapReduce中FileInputFormat的文件切片機制

1、mapTask並行度的決定機制 一個job的map階段並行度由客戶端在提交job時決定 而客戶端對map階段並行度的規劃的基本邏輯爲: 將待處理數據執行邏輯切片(即按照一個特定切片大小,將待處理數據劃分成邏輯上的多個split),然後每一個split分配一個mapTask並行實例處理   這段邏輯及形成的切片規劃描述文件,由FileInputFormat實現類的getSplits()方法完成,
相關文章
相關標籤/搜索