等概率採樣數據流中的數字

從數據流中等概率的採樣k個數字。 怎麼做呢?先拿到最開始的k個數字,然後以後的每個數字等概率的和這k個數字交換。那麼就可以達到每個數字被抽取的概率是等概率的。 怎麼證明呢? 類似題目:給定一個數據流,其中包含無窮盡的搜索關鍵字(比如,人們在谷歌搜索時不斷輸入的關鍵字)。如何才能從這個無窮盡的流中隨機的選取1000個關鍵字?
相關文章
相關標籤/搜索