大數據開發面試部分:如何爲一個Hadoop任務設置mappers的數量(大數據開發面試)

具體的數據分片是這樣的:InputFormat在默認情況下會根據hadoop集羣HDFS塊大小進行分片,每一個分片會由一個map任務來進行處理,當然用戶還是可以通過參數mapred.min.split.size參數在作業提交客戶端進行自定義設置。還有一個重要參數就是mapred.map.tasks,這個參數設置的map數量僅僅是一個提示,只有當InputFormat決定了map任務的個數比mapr
相關文章
相關標籤/搜索