mapreduce運行的5個階段

mapreduce運行的5個階段 mapreduce在運行的過程當中大體歸納爲5個步驟 1. [input階段]獲取輸入數據進行分片做爲map的輸入 2. [map階段]過程對某種輸入格式的一條記錄解析成一條或多條記錄 3. [shffle階段]對中間數據的控制,做爲reduce的輸入 4. [reduce階段]對相同key的數據進行合併 5. [output階段]按照格式輸出到指定目錄node
相關文章
相關標籤/搜索