bitmap算法

概述

所謂bitmap就是用一個bit位來標記某個元素對應的value,而key便是這個元素。因爲採用bit爲單位來存儲數據,所以在能夠大大的節省存儲空間


算法思想

32位機器上,一個整形,好比int a;在內存中佔32bit,能夠用對應的32個bit位來表示十進制的0-31個數,bitmap算法利用這種思想處理大量數據的排序與查詢

優勢:
  • 效率高,不準進行比較和移位
  • 佔用內存少,好比N=10000000;只需佔用內存爲N/8 = 1250000Bytes = 1.2M,若是採用int數組存儲,則須要38M多

缺點:
  • 沒法對存在重複的數據進行排序和查找

示例:

申請一個int型的內存空間,則有4Byte,32bit。輸入 4, 2,  1,  3時:

輸入4:



輸入2:



輸入1:



輸入3:




思想比較簡單,關鍵是十進制和二進制bit位須要一個map映射表,把10進制映射到bit位上

map映射表

假設須要排序或者查找的總數N=10000000,那麼咱們須要申請的內存空間爲 int a[N/32 + 1].其中a[0]在內存中佔32位,依此類推:

bitmap表爲:

a[0] ------> 0 - 31

a[1] ------> 32 - 63

a[2] ------> 64 - 95

a[3] ------> 96 - 127

......

下面介紹用位移將十進制數轉換爲對應的bit位


位移轉換

(1) 求十進制數0-N對應的在數組a中的下標

index_loc = N / 32便可,index_loc即爲n對應的數組下標。例如n = 76, 則loc = 76 / 32 = 2,所以76在a[2]中。

(2)求十進制數0-N對應的bit位

bit_loc = N % 32便可,例如 n = 76, bit_loc = 76 % 32 = 12

(3)利用移位0-31使得對應的32bit位爲1


代碼示例(c語言)

#include <stdio.h>
#include <stdlib.h>

#define SHIFT 5
#define MASK 0x1F

/**
 * 設置所在的bit位爲1
 *
 * T = O(1)
 *
 */
void set(int n, int *arr)
{
	int index_loc, bit_loc;

	index_loc = n >> SHIFT; // 等價於n / 32
	bit_loc = n & MASK;	// 等價於n % 32

	arr[index_loc] |= 1 << bit_loc;
}

/**
 * 初始化arr[index_loc]全部bit位爲0
 *
 * T = O(1)
 *
 */
void clr(int n, int *arr)
{
	int index_loc;

	index_loc = n >> SHIFT;

	arr[index_loc] &= 0;
}

/**
 * 測試n所在的bit位是否爲1
 *
 * T = O(1)
 *
 */
int test(int n, int *arr)
{
	int i, flag;

	i = 1 << (n & MASK);

	flag = arr[n >> SHIFT] & i;

	return flag;
}

int main(void)
{
	int i, num, space, *arr;

	while (scanf("%d", &num) != EOF) {
		// 肯定大小&&動態申請數組
		space = num / 32 + 1;
		arr = (int *)malloc(sizeof(int) * space);

		// 初始化bit位爲0
		for (i = 0; i <= num; i ++)
			clr(i, arr);

		// 設置num的比特位爲1
		set(num, arr);
		
		// 測試
		if (test(num, arr)) {
			printf("成功!\n");
		} else {
			printf("失敗!\n");
		}
	}

	return 0;
}

參考連接

相關文章
相關標籤/搜索