python3 錦鯉第一步!瞭解隨機抽樣之蓄水池算法

python3 錦鯉第一步!瞭解隨機抽樣之蓄水池算法 蓄水池算法 問題背景: 樣本空間爲N,從N個樣本中隨機不重複地抽取K個樣本,其中N是未知且非常巨大的數,如何保證每個樣本是等概率被抽取才是關鍵。 算法邏輯: (1)先選取前k個數據(0,1,2,…k-1,角標從0開始) (2)對於第i個數據(k<=i<n),隨機生成區間[0, i)的一個數r,如果r<k,則將數據替換。 近期的朋友圈都在瘋轉各式
相關文章
相關標籤/搜索