加權隨機算法

時間 2019-12-05

標籤加權隨機算法简体版

原文原文鏈接

加權隨機算法通常應用在如下場景：有一個集合S，裏面好比有A,B,C,D這四項。這時咱們想隨機從中抽取一項，可是抽取的機率不一樣，好比咱們但願抽到A的機率是50%,抽到B和C的機率是20%,D的機率是10%。通常來講，咱們能夠給各項附一個權重，抽取的機率正比於這個權重。那麼上述集合就成了：python

{A:5，B:2，C:2，D:1}算法

方法一：

擴展這個集合，使每一項出現的次數與其權重正相關。在上述例子這個集合擴展成：
{A,A,A,A,A,B,B,C,C,D}
而後就能夠用均勻隨機算法來從中選取。數組

好處：選取的時間複雜度爲O（1）,算法簡單。
壞處：空間佔用極大。另外若是權重數字位數較大，例如{A:49.1 B：50.9}的時候，就會產生巨大的空間浪費。app

方法二：

計算權重總和sum，而後在1到sum之間隨機選擇一個數R，以後遍歷整個集合，統計遍歷的項的權重之和，若是大於等於R，就中止遍歷，選擇遇到的項。dom

仍是以上面的集合爲例，sum等於10，若是隨機到1-5，則會在遍歷第一個數字的時候就退出遍歷。符合所選取的機率。python2.7

好處：沒有額外的空間佔用，算法也比較簡單。
壞處：選取的時候要遍歷集合，時間複雜度是O（n）。函數

方法三：

能夠對方法二進行優化，對項目集按照權重排序。這樣遍歷的時候，機率高的項能夠很快遇到，減小遍歷的項。
比較{A:5，B:2，C:2，D:1}和{B:2，C:2，A:5，D:1}
前者遍歷步數的指望是5/10*1+2/10*2+2/10*3+1/10*4然後者是2/10*1+2/10*2+5/10*3+1/10*4。優化

好處：提升了平均選取速度。
壞處：須要進行排序，而且不易添加刪除修改項。spa