Redis中bitmap的妙用

在Redis中咱們常常用到set,get等命令,細心的你有沒有發現,還有幾個類似的命令叫setbit,getbit,它們是用來幹嗎的?

BitMap是什麼

就是經過一個bit位來表示某個元素對應的值或者狀態,其中的key就是對應元素自己。咱們知道8個bit能夠組成一個Byte,因此bitmap自己會極大的節省儲存空間。php

Redis中的BitMap

Redis從2.2.0版本開始新增了setbit,getbit,bitcount等幾個bitmap相關命令。雖然是新命令,可是並無新增新的數據類型,由於setbit等命令只不過是在set上的擴展。redis

setbit命令介紹

指令 SETBIT key offset value
複雜度 O(1)
設置或者清空key的value(字符串)在offset處的bit值(只能只0或者1)。小程序

空間佔用、以及第一次分配空間須要的時間

在一臺2010MacBook Pro上,offset爲2^32-1(分配512MB)須要~300ms,offset爲2^30-1(分配128MB)須要~80ms,offset爲2^28-1(分配32MB)須要~30ms,offset爲2^26-1(分配8MB)須要8ms。<來自官方文檔>
大概的空間佔用計算公式是:($offset/8/1024/1024)MBsegmentfault

使用場景一:用戶簽到

不少網站都提供了簽到功能(這裏不考慮數據落地事宜),而且須要展現最近一個月的簽到狀況,若是使用bitmap咱們怎麼作?一言不合亮代碼!網站

<?php
$redis = new Redis();
$redis->connect('127.0.0.1');


//用戶uid
$uid = 1;

//記錄有uid的key
$cacheKey = sprintf("sign_%d", $uid);

//開始有簽到功能的日期
$startDate = '2017-01-01';

//今天的日期
$todayDate = '2017-01-21';

//計算offset
$startTime = strtotime($startDate);
$todayTime = strtotime($todayDate);
$offset = floor(($todayTime - $startTime) / 86400);

echo "今天是第{$offset}天" . PHP_EOL;

//簽到
//一年一個用戶會佔用多少空間呢?大約365/8=45.625個字節,好小,有木有被驚呆?
$redis->setBit($cacheKey, $offset, 1);

//查詢簽到狀況
$bitStatus = $redis->getBit($cacheKey, $offset);
echo 1 == $bitStatus ? '今天已經簽到啦' : '尚未簽到呢';
echo PHP_EOL;

//計算總簽到次數
echo $redis->bitCount($cacheKey) . PHP_EOL;

/**
* 計算某段時間內的簽到次數
* 很不幸啊,bitCount雖然提供了start和end參數,可是這個說的是字符串的位置,而不是對應"位"的位置
* 幸運的是咱們能夠經過get命令將value取出來,本身解析。而且這個value不會太大,上面計算過一年一個用戶只須要45個字節
* 給咱們的網站定一個小目標,運行30年,那麼一共須要1.31KB(就問你屌不屌?)
*/
//這是個錯誤的計算方式
echo $redis->bitCount($cacheKey, 0, 20) . PHP_EOL;

使用場景二:統計活躍用戶

使用時間做爲cacheKey,而後用戶ID爲offset,若是當日活躍過就設置爲1
那麼我該若是計算某幾天/月/年的活躍用戶呢(暫且約定,統計時間內只有有一天在線就稱爲活躍),有請下一個redis的命令
命令 BITOP operation destkey key [key ...]
說明:對一個或多個保存二進制位的字符串 key 進行位元操做,並將結果保存到 destkey 上。
說明:BITOP 命令支持 AND 、 OR 、 NOT 、 XOR 這四種操做中的任意一種參數ui

//日期對應的活躍用戶

$data = array(

'2017-01-10' => array(1,2,3,4,5,6,7,8,9,10),

'2017-01-11' => array(1,2,3,4,5,6,7,8),

'2017-01-12' => array(1,2,3,4,5,6),

'2017-01-13' => array(1,2,3,4),

'2017-01-14' => array(1,2)

);



//批量設置活躍狀態

foreach($data as $date=>$uids) {

$cacheKey = sprintf("stat_%s", $date);

foreach($uids as $uid) {

$redis->setBit($cacheKey, $uid, 1);

}

}



$redis->bitOp('AND', 'stat', 'stat_2017-01-10', 'stat_2017-01-11', 'stat_2017-01-12') . PHP_EOL;

//總活躍用戶:6

echo "總活躍用戶:" . $redis->bitCount('stat') . PHP_EOL;



$redis->bitOp('AND', 'stat1', 'stat_2017-01-10', 'stat_2017-01-11', 'stat_2017-01-14') . PHP_EOL;

//總活躍用戶:2

echo "總活躍用戶:" . $redis->bitCount('stat1') . PHP_EOL;



$redis->bitOp('AND', 'stat2', 'stat_2017-01-10', 'stat_2017-01-11') . PHP_EOL;

//總活躍用戶:8

echo "總活躍用戶:" . $redis->bitCount('stat2') . PHP_EOL;

假設當前站點有5000W用戶,那麼一天的數據大約爲50000000/8/1024/1024=6MBspa

使用場景三:用戶在線狀態

前段時間開發一個項目,對方給我提供了一個查詢當前用戶是否在線的接口。不瞭解對方是怎麼作的,本身考慮了一下,使用bitmap是一個節約空間效率又高的一種方法,只須要一個key,而後用戶ID爲offset,若是在線就設置爲1,不在線就設置爲0,和上面的場景同樣,5000W用戶只須要6MB的空間。code

//批量設置在線狀態
$uids = range(1, 500000);

foreach($uids as $uid) {

$redis->setBit('online', $uid, $uid % 2);

}

//一個一個獲取狀態

$uids = range(1, 500000);

$startTime = microtime(true);

foreach($uids as $uid) {

echo $redis->getBit('online', $uid) . PHP_EOL;

}

$endTime = microtime(true);

//在個人電腦上,獲取50W個用戶的狀態須要25秒

echo "total:" . ($endTime - $startTime) . "s";




/**

* 對於批量的獲取,上面是一種效率低的辦法,實際能夠經過get獲取到value,而後本身計算

* 具體計算方法改天再寫吧,以前寫的代碼找不見了。。。

*/

其實BitMap能夠運用的場景不少不少(固然也會受到一些限制),思惟能夠繼續擴散~歡迎小夥伴給我留言探討~blog

續篇:Redis中BitMap是如何儲存的,以及PHP如何處理接口

開發了一個數獨小程序「惟一數獨」,歡迎掃描玩起來~

圖片描述

相關文章
相關標籤/搜索