hadoop map reduce高級

InputSplit是指分片,在MapReduce當中作業中,作爲map task最小輸入單位。分片是基於文件基礎上出來的而來的概念,通俗的理解一個文件可以切分爲多 少個片段,每個片段包括了<文件名,開始位置,長度,位於哪些主機>等信息。在MapTask拿到這些分片後,會知道從哪開始讀取數據。 Job提交時如何獲取到InputSplit。用戶指定的MapTask的個數,以及文件總長度,塊大小,以及
相關文章
相關標籤/搜索