生成不重複隨機數

時間 2019-11-12

標籤生成重複隨機數简体版

原文原文鏈接

這個題目來自於《編程珠璣》第一章的問題的衍生，簡化後的需求是這樣的：要求生成小於n且沒有重複的n個隨機整數。php

通常而言，各類編程語言都有庫函數來供咱們生成隨機數，可是庫函數所生成的隨機數可能有重複，爲此，面對這個需求，我須要本身編寫無重複隨機數生成器。考慮到我使用的是php語言，因此結合這個語言所擁有的庫函數，我首先很天然的想到使用shuffle函數，這個函數的做用是打亂數組中元素的順序從新排列，因此，第一種方法的思路是這樣的：首先按照給定的範圍生成一個數組，數組中每一個位置填上對應的整數，即arr[i] = i ,而後使用shuffle函數打亂這個數組從新輸出便可。html

//生成特定範圍不重複的隨機數組
//使用shuffle函數
function createRand_shuffle($min, $max)
{
    $store = array();
    for($i=$min;$i<=$max;$i++)
    {
        $store[$i] = $i; 
    }
    shuffle($store);
    return $store;
}

若是某種編程語言庫裏沒有相似PHP的數組洗牌函數shuffle，那麼就採用第二種方法，這個方法利用了去重的思想，即仍然使用庫函數的隨機數發生器，可是爲了不產生重複的數據，須要對生成的數據進行去重處理，所以這裏就須要一個標記表來記錄已經生成的數據，以便讓新生成的數據對照。思路以下：初始化兩個數組，一個數組用來存放最終生成的數據，另外一個做爲Hash去重對照表，每次生成一個數據，首先到Hash去重數組裏檢查該數據是否已經存在，若是存在，則從新生成數據，不然存入該數據到第一個數組，同時在Hash去重數組裏標記該數據，標記採用位圖的思想，即對於數據i,標記數組第i位爲1。代碼以下：算法

//生成特定範圍不重複隨機數組
//hash去重法
function createRand_hash($min, $max)
{
    $hash = array();
    $out = array();
    for($i=$min;$i<=$max;$i++)
    {
        $randnum = rand($min,$max);
        while(@$hash[$randnum]==1)
        {
            $randnum = rand($min,$max);
        }
    $out[] = $randnum;
    @$hash[$randnum]=1;
    }
    return $out;
}

針對上面這個方法，它的缺點是每次生成一個隨機數，都須要到Hash表內進行對比，當Hash錶快滿時候，對比失敗的次數會愈來愈多，因此爲了解決這個問題，有了第三種方法。
編程

第三種方法很巧妙，尤爲是它的改進優化方法，頗有意思，來源於eaglet的博客
數組

博客做者eaglet是著名中文分詞組件盤古分詞的做者，我在網上找尋其餘思路的時候發現的。數據結構

首先講下優化前的思路：從集合的角度來說，這個方法的主要思想我認爲仍是去重，可是不一樣於第二種方法，這個方法把去重的步奏放到了源數據集合中來作，即每從源集合裏面獲取一個數據，則將該數據從源集合內刪除，保證下次不會再取到這個數據，具體的思路以下：假設n=5,則初始狀況，該數組下標與該下標所「裝」的數是對應的，如圖：編程語言