Hive基礎之分區表

我們在做數據挖掘和分析的時候有時候只是針對某一段時間或者某一個月的數據,而我們在創建表的時候是將所有時間的數據都放在一起,這樣就會導致我們在進行分析的時候會分析所有的數據,如果數據量很大的時候效率就會很慢,這時候Hive就提供一種特性叫分區表,可以針對一個月的數據進行查詢和分析。原來可能要分析100G的數據文件,經過分區後可能只需要分析10G的文件,這樣可以大大提升數據分析的效率。下面我們就來詳細
相關文章
相關標籤/搜索