1、DRBD簡介
DRBD的全稱爲:Distributed ReplicatedBlock Device(DRBD)分佈式塊設備複製,DRBD是由內核模塊和相關腳本而構成,用以構建高可用性的集羣。其實現方式是經過網絡來鏡像整個設備。你能夠把它看做是一種網絡RAID。它容許用戶在遠程機器上創建一個本地塊設備的實時鏡像。
1.一、DRBD是如何工做的呢?
(DRBD Primary)負責接收數據,把數據寫到本地磁盤併發送給另外一臺主機(DRBD Secondary)。另外一個主機再將數據存到本身的磁盤中。目前,DRBD每次只容許對一個節點進行讀寫訪問,但這對於一般的故障切換高可用集羣來講已經足夠用了。有可能之後的版本支持兩個節點進行讀寫存取。
1.二、DRBD與HA的關係
一個DRBD系統由兩個節點構成,與HA集羣相似,也有主節點和備用節點之分,在帶有主要設備的節點上,應用程序和操做系統能夠運行和訪問DRBD設備(/dev/drbd*)。在主節點寫入的數據經過DRBD設備存儲到主節點的磁盤設備中,同時,這個數據也會自動發送到備用節點對應的DRBD設備,最終寫入備用節點的磁盤設備上,在備用節點上,DRBD只是將數據從DRBD設備寫入到備用節點的磁盤中。如今大部分的高可用性集羣都會使用共享存儲,而DRBD也能夠做爲一個共享存儲設備,使用DRBD不須要太多的硬件的投資。由於它在TCP/IP網絡中運行,因此,利用DRBD做爲共享存儲設備,要節約不少成本,由於價格要比專用的存儲網絡便宜不少;其性能與穩定性方面也不錯
2、DRBD複製模式
2.一、協議A:
異步複製協議。一旦本地磁盤寫入已經完成,數據包已在發送隊列中,則寫被認爲是完成的。在一個節點發生故障時,可能發生數據丟失,由於被寫入到遠程節點上的數據可能仍在發送隊列。儘管,在故障轉移節點上的數據是一致的,但沒有及時更新。這一般是用於地理上分開的節點
2.二、協議B:
內存同步(半同步)複製協議。一旦本地磁盤寫入已完成且複製數據包達到了對等節點則認爲寫在主節點上被認爲是完成的。數據丟失可能發生在參加的兩個節點同時故障的狀況下,由於在傳輸中的數據可能不會被提交到磁盤
2.三、協議C:
同步複製協議。只有在本地和遠程節點的磁盤已經確認了寫操做完成,寫才被認爲完成。沒有任何數據丟失,因此這是一個羣集節點的流行模式,但I / O吞吐量依賴於網絡帶寬
通常使用協議C,但選擇C協議將影響流量,從而影響網絡時延。爲了數據可靠性,咱們在生產環境使用時須慎重選項使用哪種協議node
3、 DRBD工做原理圖
DRBD是Linux的內核的存儲層中的一個分佈式存儲系統,可用使用DRBD在兩臺Linux服務器之間共享塊設備,共享文件系統和數據。相似於一個網絡RAID-1的功能,如圖所示:mysql
4、安裝配置 (節點1上操做)
4.一、準備:
兩個節點ha-node1和ha-node2均按照centos7.0系統,每一個節點兩塊磁盤,一塊用做根分區一塊用做drbdlinux
192.168.8.51 ha-node1 192.168.8.52 ha-node2
節點1算法
# hostnamectl set-hostname ha-node1 # su -l
# hostnamectl set-hostname ha-node2 # su -l
[root@ha-node2 corosync]# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT sda 8:0 0 20G 0 disk ├─sda1 8:1 0 500M 0 part /boot └─sda2 8:2 0 19.5G 0 part ├─centos-swap 253:0 0 2G 0 lvm [SWAP] └─centos-root 253:1 0 17.5G 0 lvm / sdb 8:16 0 20G 0 disk sr0 11:0 1 1024M 0 rom [root@ha-node1 corosync]# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT sda 8:0 0 20G 0 disk ├─sda1 8:1 0 500M 0 part /boot └─sda2 8:2 0 19.5G 0 part ├─centos-swap 253:0 0 2G 0 lvm [SWAP] └─centos-root 253:1 0 17.5G 0 lvm / sdb 8:16 0 20G 0 disk sr0 11:0 1 1024M 0 rom
# pvcreate /dev/sdb # vgcreate data /dev/sdb # lvcreate --size 2G --name mysql data
setenforce 0 sed -i.bak "s/SELINUX=enforcing/SELINUX=permissive/g" /etc/selinux/config systemctl disable firewalld.service systemctl stop firewalld.service iptables --flush
echo '192.168.8.51 ha-node1 ' >>/etc/hosts echo '192.168.8.52 ha-node2 ' >>/etc/hosts
# chkconfig chronyd off # chkconfig ntpd on # sed -i "/^server\ 3.centos.pool/a server\ 10.239.44.128 " /etc/ntp.conf # service ntpd start # ntpq -p
# ssh-keygen -t dsa -f ~/.ssh/id_dsa -N "" # ssh-copy-id ha-node1 # ssh-copy-id ha-node2
# rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org # rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm # yum install -y kmod-drbd84 drbd84-utils
/etc/drbd.conf #主配置文件
/etc/drbd.d/global_common.conf #全局配置文件
a、/etc/drbd.conf說明
主配置文件中包含了全局配置文件及」drbd.d/」目錄下以.res結尾的文件sql
# You can find an example in /usr/share/doc/drbd.../drbd.conf.example include "drbd.d/global_common.conf"; include "drbd.d/*.res";
global { usage-count no; #是否參加DRBD使用統計,默認爲yes。官方統計drbd的裝機量 # minor-count dialog-refresh disable-ip-verification } common { protocol C; #使用DRBD的同步協議 handlers { # These are EXAMPLE handlers only. # They may have severe implications, # like hard resetting the node under certain circumstances. # Be careful when chosing your poison. pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f"; pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f"; local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f"; # fence-peer "/usr/lib/drbd/crm-fence-peer.sh"; # split-brain "/usr/lib/drbd/notify-split-brain.sh root"; # out-of-sync "/usr/lib/drbd/notify-out-of-sync.sh root"; # before-resync-target "/usr/lib/drbd/snapshot-resync-target-lvm.sh -p 15 -- -c 16k"; # after-resync-target /usr/lib/drbd/unsnapshot-resync-target-lvm.sh; } startup { # wfc-timeout degr-wfc-timeout outdated-wfc-timeout wait-after-sb } options { # cpu-mask on-no-data-accessible } disk { on-io-error detach; #配置I/O錯誤處理策略爲分離 # size max-bio-bvecs on-io-error fencing disk-barrier disk-flushes # disk-drain md-flushes resync-rate resync-after al-extents # c-plan-ahead c-delay-target c-fill-target c-max-rate # c-min-rate disk-timeout } net { # protocol timeout max-epoch-size max-buffers unplug-watermark # connect-int ping-int sndbuf-size rcvbuf-size ko-count # allow-two-primaries cram-hmac-alg shared-secret after-sb-0pri # after-sb-1pri after-sb-2pri always-asbp rr-conflict # ping-timeout data-integrity-alg tcp-cork on-congestion # congestion-fill congestion-extents csums-alg verify-alg # use-rle } syncer { rate 1024M; #設置主備節點同步時的網絡速率 } }
detach 分離:這是默認和推薦的選項,若是在節點上發生底層的硬盤I/O錯誤,它會將設備運行在Diskless無盤模式下
pass_on:DRBD會將I/O錯誤報告到上層,在主節點上,它會將其報告給掛載的文件系統,可是在此節點上就每每忽略(所以此節點上沒有能夠報告的上層)
-local-in-error:調用本地磁盤I/O處理程序定義的命令;這須要有相應的local-io-error調用的資源處理程序處理錯誤的命令;這就給管理員有足夠自由的權力命令命令或是腳本調用local-io-error處理I/O錯誤
定義一個資源
c、建立/etc/drbd.d/MySQL.res並寫入centos
resource mysql { #資源名稱 protocol C; #使用協議 meta-disk internal; device /dev/drbd1; #DRBD設備名稱 syncer { verify-alg sha1;# 加密算法 } net { allow-two-primaries; } on ha-node1 { disk /dev/data/mysql; drbd1使用的磁盤分區爲"mysql" address 192.168.8.51:7789; #設置DRBD監聽地址與端口 } on ha-node2 { disk /dev/data/mysql; address 192.168.8.52:7789; } }
# scp -rp /etc/drbd.d/* ha-node2:/etc/drbd.d/
# drbdadm create-md mysql # modprobe drbd # drbdadm up mysql # drbdadm -- --force primary mysql
# cat /proc/drbd
ssh ha-node2 「drbdadm create-md mysql」 ssh ha-node2 「modprobe drbd」 ssh ha-node2 「drbdadm up mysql」
# mkfs.xfs /dev/drbd1 # mount /dev/drbd1 /mnt
6.一、資源的鏈接狀態詳細介紹
如何查看資源鏈接狀態?api
[root@ha-node1 ~]# drbdadm cstate mysql #mysql爲資源名稱 WFConnection
StandAlone 獨立的:網絡配置不可用;資源尚未被鏈接或是被管理斷開(使用 drbdadm disconnect 命令),或是因爲出現認證失敗或是腦裂的狀況
Disconnecting 斷開:斷開只是臨時狀態,下一個狀態是StandAlone獨立的
Unconnected 懸空:是嘗試鏈接前的臨時狀態,可能下一個狀態爲WFconnection和WFReportParams
Timeout 超時:與對等節點鏈接超時,也是臨時狀態,下一個狀態爲Unconected懸空
BrokerPipe:與對等節點鏈接丟失,也是臨時狀態,下一個狀態爲Unconected懸空
NetworkFailure:與對等節點推進鏈接後的臨時狀態,下一個狀態爲Unconected懸空
ProtocolError:與對等節點推進鏈接後的臨時狀態,下一個狀態爲Unconected懸空
TearDown 拆解:臨時狀態,對等節點關閉,下一個狀態爲Unconected懸空
WFConnection:等待和對等節點創建網絡鏈接
WFReportParams:已經創建TCP鏈接,本節點等待從對等節點傳來的第一個網絡包
Connected 鏈接:DRBD已經創建鏈接,數據鏡像如今可用,節點處於正常狀態
StartingSyncS:徹底同步,有管理員發起的剛剛開始同步,將來可能的狀態爲SyncSource或PausedSyncS
StartingSyncT:徹底同步,有管理員發起的剛剛開始同步,下一狀態爲WFSyncUUID
WFBitMapS:部分同步剛剛開始,下一步可能的狀態爲SyncSource或PausedSyncS
WFBitMapT:部分同步剛剛開始,下一步可能的狀態爲WFSyncUUID
WFSyncUUID:同步即將開始,下一步可能的狀態爲SyncTarget或PausedSyncT
SyncSource:以本節點爲同步源的同步正在進行
SyncTarget:以本節點爲同步目標的同步正在進行
PausedSyncS:以本地節點是一個持續同步的源,可是目前同步已經暫停,多是由於另一個同步正在進行或是使用命令(drbdadm pause-sync)暫停了同步
PausedSyncT:以本地節點爲持續同步的目標,可是目前同步已經暫停,這能夠是由於另一個同步正在進行或是使用命令(drbdadm pause-sync)暫停了同步
VerifyS:以本地節點爲驗證源的線上設備驗證正在執行
VerifyT:以本地節點爲驗證目標的線上設備驗證正在執行
5.二、資源角色
查看資源角色命令服務器
[root@ha-node ~]# drbdadm role mysql Secondary/Secondary [root@ha-node1ha-node1 ~]# cat /proc/drbd version: 8.4.3 (api:1/proto:86-101) GIT-hash: 89a294209144b68adb3ee85a73221f964d3ee515 build by gardner@, 2013-05-27 04:30:21 0: cs:Connected ro:Secondary/Secondary ds:Inconsistent/Inconsistent C r----- ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:2103412
Parimary 主:資源目前爲主,而且可能正在被讀取或寫入,若是不是雙主只會出如今兩個節點中的其中一個節點上
Secondary 次:資源目前爲次,正常接收對等節點的更新
Unknown 未知:資源角色目前未知,本地的資源不會出現這種狀態
5.三、硬盤狀態
查看硬盤狀態命令網絡
[root@ha-node1ha-node1 ~]# drbdadm dstate mysql Inconsistent/Inconsistent
Diskless 無盤:本地沒有塊設備分配給DRBD使用,這表示沒有可用的設備,或者使用drbdadm命令手工分離或是底層的I/O錯誤致使自動分離
Attaching:讀取無數據時候的瞬間狀態
Failed 失敗:本地塊設備報告I/O錯誤的下一個狀態,其下一個狀態爲Diskless無盤
Negotiating:在已經鏈接的DRBD設置進行Attach讀取無數據前的瞬間狀態
Inconsistent:數據是不一致的,在兩個節點上(初始的徹底同步前)這種狀態出現後當即建立一個新的資源。此外,在同步期間(同步目標)在一個節點上出現這種狀態
Outdated:數據資源是一致的,可是已通過時
DUnknown:當對等節點網絡鏈接不可用時出現這種狀態
Consistent:一個沒有鏈接的節點數據一致,當創建鏈接時,它決定數據是UpToDate或是Outdated
UpToDate:一致的最新的數據狀態,這個狀態爲正常狀態
5.四、啓用和禁用資源
手動啓用資源併發
手動啓用資源 drbdadm up <resource> 手動禁用資源 drbdadm down <resource>
resource:爲資源名稱;固然也可使用all表示[停用|啓用]全部資源
5.五、升級和降級資源
升級資源 drbdadm primary <resource> 降級資源 drbdadm secondary <resource>
5.六、初始化設備同步
選擇一個初始同步源;若是是新初始化的或是空盤,這個選擇能夠是任意的,可是若是其中的一個節點已經在使用幷包含有用的數據,那麼選擇同步源是相當重要的;若是選錯了初始化同步方向,就會形成數據丟失,所以須要十分當心
啓動初始化徹底同步,這一步只能在初始化資源配置的一個節點上進行,並做爲同步源選擇的節點上;命令以下:
[root@ha-node1 ~]# drbdadm -- --overwrite-data-of-peer primary mysql [root@ha-node1 ~]# cat /proc/drbd #查看同步進度 version: 8.4.3 (api:1/proto:86-101) GIT-hash: 89a294209144b68adb3ee85a73221f964d3ee515 build by gardner@, 2013-05-27 04:30:21 0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r---n- ns:1897624 nr:0 dw:0 dr:1901216 al:0 bm:115 lo:0 pe:3 ua:3 ap:0 ep:1 wo:f oos:207988 [=================>..] synced: 90.3% (207988/2103412)K finish: 0:00:07 speed: 26,792 (27,076) K/sec ######當同步完成時如如下狀態 version: 8.4.3 (api:1/proto:86-101) GIT-hash: 89a294209144b68adb3ee85a73221f964d3ee515 build by gardner@, 2013-05-27 04:30:21 0: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r----- ns:2103412 nr:0 dw:0 dr:2104084 al:0 bm:129 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0
查看同步進度也可以使用如下命令
drbd-overview
文件系統只能掛載在主(Primary)節點上,所以在設置好主節點後才能夠對DRBD設備進行格式化操做
格式化文件系統
[root@ha-node1 ~]# mkfs.ext4 /dev/drbd1
[root@ha-node1 ~]# mount /dev/drbd1 /mnt/
[root@ha-node1 ~]# mount |grep drbd1 /dev/drbd1 on /mnt type ext4 (rw)
「/dev/drbd1」爲資源中定義已定義的資源名稱
查看DRBD狀態
[root@ha-node1 ~]# drbd-overview 0:drbd/0 Connected Primary/Secondary UpToDate/UpToDate C r-----
Primary:當前節點爲主;在前面爲當前節點
Secondary:備用節點爲次
5.八、切換主備節點
先把當前主節點降級爲次
[root@ha-node1 ~]# drbdadm secondary mysql
[root@ha-node1 ~]# drbd-overview 0:drbd/0 Connected Secondary/Secondary UpToDate/UpToDate C r-----
[root@ha-node2 ~]# drbdadm primary mysql
[root@ha-node2 ~]# drbd-overview 0:drbd/0 Connected Primary/Secondary UpToDate/UpToDate C r-----
[root@ha-node2 ~]# mount /dev/drbd1 /mnt/ [root@ha-node2 ~]# ls /mnt/ lost+found test
註釋:咱們還接着上面的實驗繼續進行,如今HA-NODE2爲主節點而HA-NODE1爲備節點
6.一、斷開主(parmary)節點;
關機、斷開網絡或從新配置其餘的IP均可以;這裏選擇的是斷開網絡
6.二、查看兩節點狀態
[root@ha-node2 ~]# drbd-overview 0:drbd/0 WFConnection Primary/Unknown UpToDate/DUnknown C r----- /mnt ext4 2.0G 68M 1.9G 4% [root@ha-node1 ~]# drbd-overview 0:drbd/0 StandAlone Secondary/Unknown UpToDate/DUnknown r-----
6.三、將HA-NODE1節點升級爲主(primary)節點並掛載資源
[root@ha-node1 ~]# drbdadm primary mysql [root@ha-node1 ~]# drbd-overview 0:drbd/0 StandAlone Primary/Unknown UpToDate/DUnknown r----- [root@ha-node1 ~]# mount /dev/drbd1 /mnt/ [root@ha-node1 ~]# mount | grep drbd1 /dev/drbd1 on /mnt type ext4 (rw)
[root@ha-node2 ~]# tail -f /var/log/messages Sep 19 01:56:06 ha-node2 kernel: d-con drbd: Terminating drbd_a_drbd Sep 19 01:56:06 ha-node2 kernel: block drbd1: helper command: /sbin/drbdadm initial-split-brain minor-0 exit code 0 (0x0) Sep 19 01:56:06 ha-node2 kernel: block drbd1: Split-Brain detected but unresolved, dropping connection! Sep 19 01:56:06 ha-node2 kernel: block drbd1: helper command: /sbin/drbdadm split-brain minor-0 Sep 19 01:56:06 ha-node2 kernel: block drbd1: helper command: /sbin/drbdadm split-brain minor-0 exit code 0 (0x0) Sep 19 01:56:06 ha-node2 kernel: d-con drbd: conn( NetworkFailure -> Disconnecting ) Sep 19 01:56:06 ha-node2 kernel: d-con drbd: error receiving ReportState, e: -5 l: 0! Sep 19 01:56:06 ha-node2 kernel: d-con drbd: Connection closed Sep 19 01:56:06 ha-node2 kernel: d-con drbd: conn( Disconnecting -> StandAlone ) Sep 19 01:56:06 ha-node2 kernel: d-con drbd: receiver terminated Sep 19 01:56:06 ha-node2 kernel: d-con drbd: Terminating drbd_r_drbd Sep 19 01:56:18 ha-node2 kernel: block drbd1: role( Primary -> Secondary )
[root@ha-node1 ~]# drbdadm role drbd Primary/Unknown [root@ha-node2 ~]# drbdadm role mysql Primary/Unknown
root@ha-node1 ~]# drbd-overview 0:mysql/0 StandAlone Primary/Unknown UpToDate/DUnknown r----- /mnt ext4 2.0G 68M 1.9G 4% [root@ha-node2 ~]# drbd-overview 0:mysql/0 WFConnection Primary/Unknown UpToDate/DUnknown C r----- /mnt ext4 2.0G 68M 1.9G 4%
6.七、在HA-NODE1備用節點處理辦法
[root@ha-node1 ~]# umount /mnt/ [root@ha-node1 ~]# drbdadm disconnect drbd drbd: Failure: (162) Invalid configuration request additional info from kernel: unknown connection Command 'drbdsetup disconnect ipv4:192.168.137.225:7789 ipv4:192.168.137.222:7789' terminated with exit code 10 [root@ha-node1 ~]# drbdadm secondary drbd [root@ha-node1 ~]# drbd-overview 0:drbd/0 StandAlone Secondary/Unknown UpToDate/DUnknown r----- [root@ha-node1 ~]# drbdadm connect --discard-my-data drbd
[root@ha-node1 ~]# drbd-overview 0:drbd/0 WFConnection Secondary/Unknown UpToDate/DUnknown C r-----
[root@ha-node2 ~]# drbdadm connect drbd
[root@ha-node2 ~]# drbd-overview 0:mysql/0 Connected Primary/Secondary UpToDate/UpToDate C r----- /mnt ext4 2.0G 68M 1.9G 4% [root@ha-node1 ~]# drbd-overview 0:mysql/0 Connected Secondary/Primary UpToDate/UpToDate C r-----