【算法】蓄水池抽樣算法(Reservoir Sampling)

轉載鏈接蓄水池抽樣算法 簡單理解: 算法思路大致如下: 如果接收的數據量小於m,則依次放入蓄水池。 當接收到第i個數據時,i >= m,在[0, i]範圍內取以隨機數d,若d的落在[0, m-1]範圍內,則用接收到的第i個數據替換蓄水池中的第d個數據。 重複步驟2。 算法的精妙之處在於:當處理完所有的數據時,蓄水池中的每個數據都是以m/N的概率獲得的。 下面用白話文推導驗證該算法。假設數據開始編號
相關文章
相關標籤/搜索