Hadoop MultiOutputs 實現

時間 2019-12-06

原文原文鏈接

工做中有人問 MultiOutputs 實現爲啥在指定reduce數爲1時結果文件數依然是好多個？這其實由其實現邏輯決定的。java 在MR中通常job均可以經過map reduce 默認的OutputCollector 實現寫入做業初始化時指定格式的輸出中，只能一個文件格式。當須要將結果分門別類區分或者使用不一樣格式存儲在多個文件結果中時就須要 MultiOutputs了。git M

>>阅读原文<<