海量數據隨機選取

海量數據隨機選取 轉自更詳細的大神博客 問題1:在不知道文件總行數的情況下,如何從文件中隨機的抽取一行,並且每行被抽中的概率相等? 問題2:在不知道文件總行數的情況下,如何從文件中隨機的抽取 k 行,並且每行被抽中的概率相等? 問題一:抽取一行 在知道文件行數的情況下,直接用 rand 函數就可以 不知道文件行數的時候,我們需要一個概念來使得對每一行取出的概率相等,也即隨機。這個概念即蓄水池抽樣
相關文章
相關標籤/搜索