Redis數據分片以及擴容

投稿介紹:xiaotianqio,資深linux菜鳥程序員,搜索系統磚家,曾混跡於百度的互聯網吊絲。剛開始接觸Redis,大言不慚,聊卿一讀。html

場景

一開始數據比較少,一臺服務器的內存就足夠,所以一個Redis 就能知足需求,可是隨着業務發展,數據量變大,可能須要在多臺服務器上運行多個Redis,因此須要將已有的數據進行分片(避免數據丟失),不一樣的片交給不一樣的Redis 服務。若是在一開始就考慮到這個問題,在只有一個Redis時,也將數據存放在Redis的不一樣db中,當增長Redis時,將dump.rdb中的數據按照db切分爲多個文件,每一個Redis使用各自的db,經過這種方式來實現無縫的擴展,所以須要有腳本可以切分dump.rdb。linux

分片方法

咱們單服務器的內存是64G,咱們估計64* 16G 在很長一段時間內是知足需求的,可是這個數據積累的過程可能比較緩慢,很長一段時間不會超過64G,所以一臺Redis 服務器就足夠,可是爲了考慮到之後的擴展,一開始將數據sharding 到16個db中,也就是說在只有一個Redis時,client每次寫數據會先計算key的hash,模16,獲得db num,select db,而後寫入,也能夠爲每一個db 保持一個client,這樣就能夠避免每次select db 了。 當須要變動爲兩個Redis時,爲了避免丟失數據,須要將原來Redis的數據分爲2份,一份是db 0-7,第二份是db 8-15,  用這兩個數據啓動Redis,就能夠實現擴容了,所以必需要要有腳本可以切分Redis dump 出來的dump.rdb, 下面介紹咱們的切分腳本:程序員

  1. dump.rdb 結構: head + db 0 + db 1 + … + db n + eof
  2. 修改Redis,在啓動過程當中打印出每部分的offset
  3. 提供一個c 程序,能夠將一個大文件按照指定的offset 進行切分
  4. 將切分出的各個部分進行從新組裝

例如咱們的例子redis

  1. 初始時dump.rdb 的結構: head + db0 + … + db15 + eof
  2. 獲得head 以及每一個db的offset
  3. 切分出head, db0 + … + db7 , db8 + … + db15 三個部分
  4. 將head ,db0 + … + db7 cat 在一個文件中,並在結尾加上eof,一樣,將head , db7 + … + db15 cat在一個文件中,加上eof
  5. 用上面的兩個文件啓動Redis,完成數據切分

腳本

切分腳本以下sql

echo "Usage start-end db"
startdb=$1             #上面的例子start 0
enddb=$2              # end 是 7
outdb="$1-$2.rdb"  #輸出文件的名字
if [[ ! -f "dump.rdb" ]]; then            #使用當前目錄下dump.rdb 做爲源文件
echo "no dump.rdb,must have"
exit -1
fi

#使用修改過的redis,打印offset,而後退出,使用awk 獲得head 的offset
headstart=`/global/share/bin/chenjp/redis-db-offset >& tmp.log ; cat tmp.log | grep offset | grep -v dbid | awk -F '=' '{print $NF}'`

headfile="split-0-$headstart" #head所在文件
/global/share/bin/chenjp/vsplit dump.rdb 0 $headstart  #根據offset 切分文件,0- headoffset 爲head
dbstartoffset=`cat tmp.log | grep "dbid=$startdb" | awk -F '=|,' '{print $(NF-2)}'`  #找到db的offset
dbendoffset=`cat tmp.log | grep "dbid=$enddb" | awk -F '=|,' '{print $(NF-2)}'`

if [[ $dbendoffset -eq "" ]];then
dbendoffset=`ls -l dump.rdb  | awk -F ' ' '{print $5}'`
fi
echo "start:"$dbstartoffset":"$dbendoffset
dbfile="split-$dbstartoffset-$dbendoffset"
/global/share/bin/chenjp/vsplit dump.rdb $dbstartoffset $dbendoffset  #獲得db 文件
cat $headfile $dbfile > $outdb  #拼接
printf "\xff" >> $outdb            #eof

#rm -rf tmp.log
#rm -rf split-*
echo "file $dbfile ok, containts db $startdb to $enddb, pls mv to dump.rdb to start redis server"

redis-db-offset原理

而上面的redis-db-offset實現也並不困難,只須要在load的時候將各個db開始的offset值打印也來就好了。diff以下:服務器

[chenjp@nb290 redis-2.4.10]$ diff src/rdb.c  ../../redis-2.4.10/src/rdb.c
959c959
<
---
>     fprintf(stderr,"redis_db head finished,offset=%lld\n",ftell(fp));
982a983,984
>
>             long db_start = ftell(fp) - 1;
988a991
>             fprintf(stderr,"redis_db select,offset=%lld,dbid=%d\n",db_start,dbid);
[chenjp@nb290 redis-2.4.10]$ diff src/redis.c  ../../redis-2.4.10/src/redis.c
1790a1791,1792
>
>         //exit(1);


轉自:http://blog.nosqlfan.com/html/4092.html
nosql

相關文章
相關標籤/搜索