BitMap 算法

什麼是 BigMap 算法

所謂 BitMap 就是用一個 bit 位來標記某個元素對應的 value,而 key 便是這個元素。因爲採用bit爲單位來存儲數據,所以在能夠大大的節省存儲空間。

算法思想

32位機器上,一個整形,好比 int a; 在內存中佔32bit,能夠用對應的32個bit位來表示十進制的0-31個數,bitmap算法利用這種思想處理大量數據的排序與查詢。

優勢:
  • 效率高,不準進行比較和移位
  • 佔用內存少,好比N=10000000;只需佔用內存爲N/8 = 1250000Bytes = 1.2M,若是採用int數組存儲,則須要38M多
缺點:
  • 沒法對存在重複的數據進行排序和查找
示例:

申請一個int型的內存空間,則有4Byte,32bit。輸入 4, 2,  1,  3時:

輸入4:



輸入2:



輸入1:



輸入3:


思想比較簡單,關鍵是十進制和二進制bit位須要一個 map 映射表,把10進制映射到bit位上。

map映射表

假設須要排序或者查找的總數N=10000000,那麼咱們須要申請的內存空間爲 int a[N/32 + 1].其中a[0]在內存中佔32位,依此類推:

bitmap表爲:

a[0] ------> 0 - 31

a[1] ------> 32 - 63

a[2] ------> 64 - 95

a[3] ------> 96 - 127

......

下面介紹用位移將十進制數轉換爲對應的bit位

位移轉換

(1) 求十進制數 0-N 對應的在數組 a 中的下標

index_loc = N / 32便可,index_loc即爲n對應的數組下標。例如n = 76, 則loc = 76 / 32 = 2,所以76在a[2]中。

(2)求十進制數0-N對應的bit位

bit_loc = N % 32便可,例如 n = 76, bit_loc = 76 % 32 = 12

(3)利用移位0-31使得對應的32bit位爲1

代碼示例(c語言)

#include <stdio.h>
#include <stdlib.h>

#define SHIFT 5
#define MASK 0x1F

/**
 * 設置所在的bit位爲1
 *
 * T = O(1)
 *
 */
void set(int n, int *arr)
{
    int index_loc, bit_loc;

    index_loc = n >> SHIFT; // 等價於n / 32
    bit_loc = n & MASK;    // 等價於n % 32 。 h%2^n = h & (2^n -1)

    arr[index_loc] |= 1 << bit_loc;
}

/**
 * 初始化arr[index_loc]全部bit位爲0
 *
 * T = O(1)
 *
 */
void clr(int n, int *arr)
{
    int index_loc;
    index_loc = n >> SHIFT;
    arr[index_loc] &= 0;
}

/**
 * 測試n所在的bit位是否爲1
 *
 * T = O(1)
 *
 */
int test(int n, int *arr)
{
    int i, flag;
    i = 1 << (n & MASK);
    flag = arr[n >> SHIFT] & i;
    return flag;
}

int main(void)
{
    int i, num, space, *arr;
    while (scanf("%d", &num) != EOF) {
        // 肯定大小&&動態申請數組
        space = num / 32 + 1;
        arr = (int *)malloc(sizeof(int) * space);

        // 初始化bit位爲0
        for (i = 0; i <= num; i ++)
            clr(i, arr);

        // 設置num的比特位爲1
        set(num, arr);
        
        // 測試
        if (test(num, arr)) {
            printf("成功!\n");
        } else {
            printf("失敗!\n");
        }
    }
    return 0;
}

MARK 補充 Java 實現html

 

參考:http://www.cnblogs.com/dyllove98/archive/2013/07/26/3217741.html算法

相關文章
相關標籤/搜索