LINUX下多路徑(multi-path)介紹及使用

 
1、什麼是多路徑
普通的電腦主機都是一個硬盤掛接到一個總線上,這裏是一對一的關係。而到了有光纖組成的SAN環境,或者由iSCSI組成的IPSAN環境,因爲主機和存儲經過了光纖交換機或者多塊網卡及IP來鏈接,這樣的話,就構成了多對多的關係。也就是說,主機到存儲能夠有多條路徑能夠選擇。主機到存儲之間的IO由多條路徑能夠選擇。每一個主機到所對應的存儲能夠通過幾條不一樣的路徑,若是是同時使用的話,I/O流量如何分配?其中一條路徑壞掉了,如何處理?還有在操做系統的角度來看,每條路徑,操做系統會認爲是一個實際存在的物理盤,但實際上只是通向同一個物理盤的不一樣路徑而已,這樣是在使用的時候,就給用戶帶來了困惑。多路徑軟件就是爲了解決上面的問題應運而生的。
多路徑的主要功能就是和存儲設備一塊兒配合實現以下功能:
1.故障的切換和恢復
2.IO流量的負載均衡
3.磁盤的虛擬化
因爲多路徑軟件是須要和存儲在一塊兒配合使用的,不一樣的廠商基於不一樣的操做系統,都提供了不一樣的版本。而且有的廠商,軟件和硬件也不是一塊兒賣的,若是要使用多路徑軟件的話,可能還須要向廠商購買license才行。好比EMC公司基於linux下的多路徑軟件,就須要單獨的購買license。好在, RedHat和Suse的2.6的內核中都自帶了免費的多路徑軟件包,而且能夠無償使用,同時也是一個比較通用的包,能夠支持大多數存儲廠商的設備,即便是一些不是出名的廠商,經過對配置文件進行稍做修改,也是能夠支持並運行的很好的。
 
 
2、Linux下multipath介紹,須要如下工具包:
在CentOS 5中,最小安裝系統時multipath已經被安裝,查看multipath是否安裝以下:
p_w_picpath
1 、device-mapper-multipath:即multipath-tools。主要提供multipathd和multipath等工具和 multipath.conf等配置文件。這些工具經過device mapper的ioctr的接口建立和配置multipath設備(調用device-mapper的用戶空間庫。建立的多路徑設備會在/dev /mapper中)。

2 、 device-mapper:主要包括兩大部分:內核部分和用戶部分。內核部分主要由device mapper核心(dm.ko)和一些target driver(md-multipath.ko)。核心完成設備的映射,而target根據映射關係和自身特色具體處理從mappered device 下來的i/o。同時,在覈心部分,提供了一個接口,用戶經過ioctr可和內核部分通訊,以指導內核驅動的行爲,好比如何建立mappered device,這些divece的屬性等。linux device mapper的用戶空間部分主要包括device-mapper這個包。其中包括dmsetup工具和一些幫助建立和配置mappered device的庫。這些庫主要抽象,封裝了與ioctr通訊的接口,以便方便建立和配置mappered device。multipath-tool的程序中就須要調用這些庫。
3 、dm-multipath.ko和dm.ko:dm.ko是device mapper驅動。它是實現multipath的基礎。dm-multipath實際上是dm的一個target驅動。
4 、scsi_id: 包含在udev程序包中,能夠在multipath.conf中配置該程序來獲取scsi設備的序號。經過序號,即可以判斷多個路徑對應了同一設備。這個是多路徑實現的關鍵。scsi_id是經過sg驅動,向設備發送EVPD page80或page83 的inquery命令來查詢scsi設備的標識。但一些設備並不支持EVPD 的inquery命令,因此他們沒法被用來生成multipath設備。但能夠改寫scsi_id,爲不能提供scsi設備標識的設備虛擬一個標識符,並輸出到標準輸出。multipath程序在建立multipath設備時,會調用scsi_id,從其標準輸出中得到該設備的scsi id。在改寫時,須要修改scsi_id程序的返回值爲0。由於在multipath程序中,會檢查該直來肯定scsi id是否已經成功獲得。
3、multipath在CentOS 5中的基本配置過程:
1 、安裝和加載多路徑軟件包
# yum –y install device-mapper device-mapper-multipath
# chkconfig –level 2345 multipathd on #設置成開機自啓動multipathd
# lsmod |grep dm_multipath #來檢查安裝是否正常
p_w_picpath
若是模塊沒有加載成功請使用下列命初始化DM,或重啓系統
---Use the following commands to initialize and start DM for the first time:
# modprobe dm-multipath
# modprobe dm-round-robin
# service multipathd start
# multipath –v2

2 、配置multipath:
Multipath的配置文件是/etc/multipath.conf , 如須要multipath正常工做只須要以下配置便可:(若是須要更加詳細的配置,請看本文後續的介紹)
blacklist {
devnode "^sda"
}
defaults {
user_friendly_names yes
path_grouping_policy multibus
failback immediate
no_path_retry fail
}
# vi /etc/multipath.conf
p_w_picpath
 
三、 multipath基本操做命令
# /etc/init.d/multipathd start #開啓mulitipath服務
# multipath -F #刪除現有路徑
# multipath -v2 #格式化路徑
# multipath -ll #查看多路徑
p_w_picpath
若是配置正確的話就會在/dev/mapper/目錄下多出mpath0、mpath1等之類設備。
p_w_picpath
用fdisk -l命令能夠看到多路徑軟件建立的磁盤,以下圖中的/dev/dm-[0-3]
p_w_picpath
 
四、 multipath磁盤的基本操做
要對多路徑軟件生成的磁盤進行操做直接操做/dev/mapper/目錄下的磁盤就行.
在對多路徑軟件生成的磁盤進行分區以前最好運行一下pvcreate命令:
# pvcreate /dev/mapper/mpath0
# fdisk /dev/mapper/mpath0
p_w_picpath
用fdisk對多路徑軟件生成的磁盤進行分區保存時會有一個報錯,此報錯不用理會。
fdisk對多路徑軟件生成的磁盤進行分區以後,所生成的磁盤分區並無立刻添加到/dev/目錄下,此時咱們要重啓IPSAN或者FCSAN的驅動,若是是用iscsi-initiator來鏈接IPSAN的重啓ISCSI服務就能夠發現所生成的磁盤分區了
# service iscsi restart
# ls -l /dev/mapper/
p_w_picpath
如上圖中的mpath0p1和mpath1p1就是咱們對multipath磁盤進行的分區
# mkfs.ext3 /dev/mapper/mpath0p1 #對mpath1p1分區格式化成ext3文件系統
# mount /dev/mapper/mpath0p1 /ipsan/ #掛載mpath1p1分區
p_w_picpath
 
 
 
4、multipath的高有配置
以上都是用multipath的默認配置來完成multipath的配置,好比映射設備的名稱,multipath負載均衡的方法都是默認設置。那有沒有按照咱們本身定義的方法來配置multipath呢,當能夠。
1 、multipath.conf 文件的配置
接下來的工做就是要編輯/etc/multipath.conf的配置文件
multipath.conf主要包括blacklist、multipaths、devices三部份的配置
blacklist 配置
blacklist {
devnode "^sda"
}
Multipaths 部分配置multipaths和devices兩部份的配置。
multipaths {
multipath {
wwid **************** #此值multipath -v3能夠看到
alias iscsi-dm0 #映射後的別名,能夠隨便取
path_grouping_policy multibus #路徑組策略
path_checker tur #決定路徑狀態的方法
path_selector "round-robin 0" #選擇那條路徑進行下一個IO操做的方法
}
Devices 部分配置
devices {
device {
vendor "iSCSI-Enterprise" #廠商名稱
product "Virtual disk" #產品型號
path_grouping_policy multibus #默認的路徑組策略
getuid_callout "/sbin/scsi_id -g -u -s /block/%n" #得到惟一設備號使用的默認程序
prio_callout      "/sbin/acs_prio_alua %d" #獲取有限級數值使用的默認程序
path_checker readsector0 #決定路徑狀態的方法
path_selector "round-robin 0" #選擇那條路徑進行下一個IO操做的方法
failback        immediate #故障恢復的模式
   no_path_retry      queue #在disable queue以前系統嘗試使用失效路徑的次數的數值
  rr_min_io       100 #在當前的用戶組中,在切換到另一條路徑以前的IO請求的數目
}
}
以下是一個完整的配置文件
blacklist {
devnode "^sda"
}
defaults {
user_friendly_names no
}
multipaths {
multipath {
wwid 14945540000000000a67854c6270b4359c66c272e2f356321
alias iscsi-dm0
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 14945540000000000dcca2eda91d70b81edbcfce2357f99ee
alias iscsi-dm1
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 1494554000000000020f763489c165561101813333957ed96
alias iscsi-dm2
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
multipath {
wwid 14945540000000000919ca813020a195422ba3663e1f03cc3
alias iscsi-dm3
path_grouping_policy multibus
path_checker tur
path_selector "round-robin 0"
}
}
devices {
device {
vendor "iSCSI-Enterprise"
product "Virtual disk"
path_grouping_policy multibus
getuid_callout "/sbin/scsi_id -g -u -s /block/%n"
path_checker readsector0
path_selector "round-robin 0"
}
}
獲取wwid的方法:
(1)默認狀況下,將使用 /var/lib/multipath/bindings 內的配置設定具體每一個多路徑設備名,若是在/etc/multipath.conf中有設定各wwid 別名,別名會覆蓋此設定。
p_w_picpath
(2)# multipath -v3命令查找
p_w_picpath
2 、負載均衡測試
使用dd命令來對設備進行寫操做,並同時經過iostat來查看I/0狀態,命令及輸出以下:
# dd if=/dev/zero of=/dev/mapper/iscsi-dm1p1
開啓另一個終端用如下命令查看IO狀況
# iostat 10 10
p_w_picpath
經過上述輸出,咱們看到,在對/dev/mapper/iscsi-dm1p1讀寫時,其實是經過對/dev/md-1包含的當前active的全部設備,即/dev/sde1,/dev/shl這2條路徑來完成對實際的LUN的寫過程。
3 、路徑切換測試
首先,咱們拔掉服務器上一根網線,通過不到10秒,咱們看到:MPIO成功地從上述「失敗」的路徑/dev/sel切換到了另一條路徑/dev/sdh1上。
相關文章
相關標籤/搜索