HIVE 合併小文件

今天,用Flink寫入hive的時候,突然想到一個問題,就是如果隔一個小時生成一個文件,那麼kafka的並行度爲12,也就是說,一個小時會產生12個文件。一天就是12*24個文件,10天,就有2000多個文件。這個肯定是不可取的。 於是研究一下,如何合併hive小文件,大家可以參考https://cloud.tencent.com/developer/article/1514064 這篇文章。於是
相關文章
相關標籤/搜索