Hive學習之抽樣(Sampling)

      當數據量特別大時,對全體數據進行處理存在困難時,抽樣就顯得尤爲重要了。抽樣能夠從被抽取的數據中估計和推斷出總體的特性,是科學實驗、質量檢驗、社會調查廣泛採用的一種經濟有效的工做和研究方法。java       Hive支持桶表抽樣和塊抽樣,下面分別學習。所謂桶表指的是在建立表時使用CLUSTERED BY子句建立了桶的表。桶表抽樣的語法以下:git table_sample: TABL
相關文章
相關標籤/搜索