CombineTextInputFormat切片機制

CombineTextInputFormat切片機制        框架默認的TextInputFormat切片機制是對任務按文件規劃切片,不管文件多小,都會是一個單獨的切片,都會交給一個MapTask,這樣如果有大量小文件,就會產生大量的MapTask,處理效率極其低下。   1、應用場景:          CombineTextInputFormat用於小文件過多的場景,它可以將多個小文件從
相關文章
相關標籤/搜索