Hadoop MultiOutputs 實現

工做中有人問 MultiOutputs 實現爲啥在指定reduce數爲1時  結果文件數依然是 好多個?這其實由其實現邏輯決定的。java 在MR中 通常job均可以經過map reduce 默認的OutputCollector 實現 寫入做業初始化時指定格式的輸出中,只能一個文件格式。當須要將結果分門別類區分或者使用不一樣格式存儲在多個文件結果中時 就須要 MultiOutputs了。git M
相關文章
相關標籤/搜索