使用Hive如何進行抽樣查詢?

對於很是大的數據集,有時用戶須要使用的是一個具備表明性的查詢結果,而不是所有結果。Hive能夠經過分桶抽樣來知足這個需求。函數

經過rand()函數實現抽樣(能夠經過分桶裁剪提升抽樣效率)效率

經過塊抽樣(百分比)實現抽樣數據

注:在使用rand進行抽樣是能夠使用桶進行輸入裁剪。查詢

相關文章
相關標籤/搜索