Linux多路径的使用及介绍

时间:2020-12-05 23:21:26
作者:kent 出自: [url]http://kentfang.blog.sohu.com/[/url]

多路径(multi-path)软件的介绍

普通的电脑主机都是一个硬盘挂接到一个总线上,这里是一对一的关系。而到了有光纤组成的SAN环境,由于主机和存储通过了光纤交换机连接,这样的话,就构成了多对多的关系。也就是说,主机到存储可以有多条路径可以选择。主机到存储之间的IO由多条路径可以选择,如下图:  Linux多路径的使用及介绍  根据上图所示,每个主机到所对应的存储可以经过几条不同的路径,如果是同时使用的话,I/O流量如何分配?其中一条路径坏掉了,如何处理?还有在操作系统的角度来看,每条路径,操作系统会认为是一个实际存在的物理盘,但实际上只是通向同一个物理盘的不同路径而已,这样是在使用的时候,就给用户带来了困惑。多路径软件就是为了解决上面的问题应运而生的。多路径的主要功能就是和存储设备一起配合实现如下功能: 1.       故障的切换和恢复 2.       IO流量的负载均衡 3.       磁盘的虚拟化 由于多路径软件是需要和存储在一起配合使用的,不同的厂商基于不同的操作系统,都提供了不同的版本。并且有的厂商,软件和硬件也不是一起卖的,如果要使用多路径软件的话,可能还需要向厂商购买license才行。比如EMC公司基于linux下的多路径软件,就需要单独的购买license。好在, RedHatSuse2.6的内核中都自带了免费的多路径软件包,并且可以免费使用,同时也是一个比较通用的包,可以支持大多数存储厂商的设备,即使是一些不是出名的厂商,通过对配置文件进行稍作修改,也是可以支持并运行的很好的。      本文一下的部分将专门针对Linux下多路径软件的配置安装,以及一些结合实际的操作进行详细的介绍(以下操作均在Suse10 SP1下进行)

多路径软件包的构成

device-mapper-1.02.13-6.9.i586.rpm        该软件运行在底层,主要进行设备虚拟化和映射。 multipath-tools-0.4.7-34.18.i586.rpm,这个软件包可以在 多路径的管理和监控工具,主要进行路径状态的检测,管理工作    

多路径软件包的安装

   Rpm �Civh device-mapper-1.02.13-6.9.i586.rpm  Rpm �Civh  multipath-tools-0.4.7-34.18.i586.rpm 安装完成后,使用命令modprobe  dm_multipath来加载相应的模块,可以使用lsmod |grep dm_multipath来检查安装是否正常。    

配置文件的修改及创建

接下来的工作就是要创建一个multipath.conf的配置文件,该文件在安装后不会自动创建。不过有一个模板可以使用,使用如下命令可以创建一个multipath.conf的文件了     cp /usr/share/doc/packages/multipath-tools/multipath.conf.synthetic  /etc/multipath.conf   然后再该文件的最后一段加上如下配置:        devices {        device {                                                   vendor                  "EMC"   //厂商名称               product                 "CaXXXXX"  //产品型号               path_grouping_policy     group_by_prio //默认的路径组策略               getuid_callout          "/sbin/scsi_id -p 0x80 -g -u -s /block/%n" //获得唯一设备号使用的默认程序         prio_callout            "/sbin/acs_prio_alua %d" //获取有限级数值使用的默认程序         hardware_handler        "1 acs" //确认用来在路径切换和IO错误时,执行特定的操作的模块。               path_checker         hp_sw  //决定路径状态的方法               path_selector         "round-robin 0" //选择那条路径进行下一个IO操作的方法               failback          immediate  //故障恢复的模式               no_path_retry        queue //disable queue之前系统尝试使用失效路径的次数的数值               rr_min_io              100 //在当前的用户组中,在切换到另外一条路径之前的IO请求的数目        }   }     编辑modprobe.conf文件,用来设置驱动程序的参数。 /etc/modprobe.conf.local  增加一行 "options scsi_mod dev_flags=Accusys:ACS92102:0x1000"  

重新编译引导文件

   "cp -f /boot/initrd-2.6.[kernel_version].img ./initrd-2.6.[k_v].img.bak"  "mkinitrd"  做完上述操作后,注意要将操作系统重新启动

 磁盘的分区及使用

创建多路径设备的分区,这里主要一下,多路径的分区只适合使用kpartx工具,不要使用fdisk进行分区。 ---------------------------------   Step2,  kpartx -l /dev/dm-0            //lists all partitions on this device Step3,  kpartx -a /dev/dm-0            //create all device node on this device kpartx -a /dev/mapper/      //多路径的设备不可以使用fdisk进行分区,必须使用kpartx -a进行分区后,再进行格式化。  

查看映射关系

  Suse3:/sbin # ls -la /dev/disk/by-name/ total 0 drwxr-xr-x 2 root root 200 Aug  1 09:01 . drwxr-xr-x 7 root root 140 Jul 31 18:05 .. lrwxrwxrwx 1 root root  10 Aug  1 09:01 SAccusys_ACS92102_010c3b973ffbc469ce11eb4d2db9d677 -> ../../dm-5 lrwxrwxrwx 1 root root  10 Aug  1 09:01 SAccusys_ACS92102_010c3b973ffbc469ce11eb4d2db9d677-part1 -> ../../dm-7 lrwxrwxrwx 1 root root  10 Aug  1 09:01 SAccusys_ACS92102_1fbdf62d63e62b625aaea9eb8c7e45cf -> ../../dm-4 lrwxrwxrwx 1 root root  10 Aug  1 09:01 SAccusys_ACS92102_1fbdf62d63e62b625aaea9eb8c7e45cf-part1 -> ../../dm-6 lrwxrwxrwx 1 root root  10 Aug  1 08:46 SAccusys_ACS92102_6d71358b45505925b5bd17ff49d554f3 -> ../../dm-0 lrwxrwxrwx 1 root root  10 Aug  1 08:46 SAccusys_ACS92102_6d71358b45505925b5bd17ff49d554f3-part1 -> ../../dm-1 lrwxrwxrwx 1 root root  10 Jul 31 18:08 SAccusys_ACS92102_f0ade6db4a8d13de2c30fd5efae7b91c -> ../../dm-2 lrwxrwxrwx 1 root root  10 Jul 31 18:10 SAccusys_ACS92102_f0ade6db4a8d13de2c30fd5efae7b91c-part1 -> ../../dm-3

几个比较有用的命令

  1.start/stop multipathd process "service multipathd start/stop" 2.display the multipath topology "multipath -ll" //非常有用的命令。 3.display the multipath debug info "multipath -v3" 4.Scan the HD "fdisk -l" 5.view the FC wwn " cat /sys/class/fc_host/host1/node_name " 下面是举例:  multipath -ll    Successful info:   SAccusys_ACS92102_3a095edea90dc919f0da043d118fd8c5dm-0 Accusys,ACS92102 [size=20G][features=1 queue_if_no_path][hwhandler=1 acs] \_ round-robin 0 [prio=400][active]----//表示当前的正在使用控制器  \_ 1:0:1:0 sdc 8:32  [active][ready]  \_ 1:0:2:0 sdd 8:48  [active][ready]  \_ 2:0:1:0 sdg 8:96  [active][ready]  \_ 2:0:2:0 sdh 8:112 [active][ready] ----//c,d,g,h可以理解为路径 \_ round-robin 0 [prio=0][enabled]-----//备份控制器  \_ 1:0:0:0 sdb 8:16  [active][ghost]  \_ 1:0:3:0 sde 8:64  [active][ghost]  \_ 2:0:0:0 sdf 8:80  [active][ghost]  \_ 2:0:3:0 sdi 8:128 [active][ghost]   //      faulty info   sdc: checker msg is "hp_sw checker reports path is down" //路径出现故障 sdd: checker msg is "hp_sw checker reports path is down" //路径出现故障 sdh: checker msg is "hp_sw checker reports path is down" //路径出现故障 SAccusys_ACS92102_3a095edea90dc919f0da043d118fd8c5dm-0 Accusys,ACS92102 [size=20G][features=1 queue_if_no_path][hwhandler=1 acs] \_ round-robin 0 [prio=0][enabled]      ---- //两个都是enabled状态,一控制器故障,另外一个控制器没有failover  \_ 1:0:1:0 sdc 8:32  [failed][faulty]  \_ 1:0:2:0 sdd 8:48  [failed][faulty]  \_ 2:0:1:0 sdg 8:96  [failed][faulty]  \_ 2:0:2:0 sdh 8:112 [failed][faulty] \_ round-robin 0 [prio=0][enabled]      ----  \_ 1:0:0:0 sdb 8:16  [active][ghost]  \_ 1:0:3:0 sde 8:64  [active][ghost]  \_ 2:0:0:0 sdf 8:80  [active][ghost]  \_ 2:0:3:0 sdi 8:128 [active][ghost]    控制器重新启动后,Suse有时候需要重新启动才可以使用。   multipath -ll SAccusys_ACS92102_3a095edea90dc919f0da043d118fd8c5dm-0 Accusys,ACS92102 [size=20G][features=1 queue_if_no_path][hwhandler=1 acs] \_ round-robin 0 [prio=200][active]  \_ 1:0:0:0 sdb 8:16  [active][ready]  \_ 1:0:1:0 sdc 8:32  [active][ready]  \_ 2:0:0:0 sdd 8:48  [active][ready]  \_ 2:0:1:0 sde 8:64  [active][ready]      multipath的所有的相关的文件   -rwxr--r--    1 root    root             2554 Jun 30 16:26 /etc/init.d/boot.multipath -rwxr--r--    1 root    root             3700 Jun 30 16:26 /etc/init.d/multipathd drwxr-xr-x    2 root    root                0 Jun 30 16:26 /etc/udev drwxr-xr-x    2 root    root                0 Jun 30 16:26 /etc/udev/rules.d -rw-r--r--    1 root    root             1185 Jun 30 16:26 /etc/udev/rules.d/71-multipath.rules -rw-r--r--    1 root    root              262 Jun 30 16:26 /etc/udev/rules.d/72-multipath-compat.rules -rwxr-xr-x    1 root    root             4872 Jun 30 16:26 /sbin/devmap_name -rwxr-xr-x    1 root    root            22824 Jun 30 16:26 /sbin/kpartx -rwxr-xr-x    1 root    root             1114 Jun 30 16:26 /sbin/kpartx_id -rwxr-xr-x    1 root    root              296 Jun 30 16:26 /sbin/mpath_id -rwxr-xr-x    1 root    root             8404 Jun 30 16:26 /sbin/mpath_prio_alua -rwxr-xr-x    1 root    root             7852 Jun 30 16:26 /sbin/mpath_prio_balance_units -rwxr-xr-x    1 root    root             4208 Jun 30 16:26 /sbin/mpath_prio_emc -rwxr-xr-x    1 root    root             5492 Jun 30 16:26 /sbin/mpath_prio_hds_modular -rwxr-xr-x    1 root    root             5984 Jun 30 16:26 /sbin/mpath_prio_netapp -rwxr-xr-x    1 root    root             3284 Jun 30 16:26 /sbin/mpath_prio_random -rwxr-xr-x    1 root    root             4184 Jun 30 16:26 /sbin/mpath_prio_tpc -rwxr-xr-x    1 root    root           121888 Jun 30 16:26 /sbin/multipath -rwxr-xr-x    1 root    root           146996 Jun 30 16:26 /sbin/multipathd drwxr-xr-x    2 root    root                0 Jun 30 16:26 /usr/share/doc/packages/multipath-tools -rw-r--r--    1 root    root               49 Nov 11  2005 /usr/share/doc/packages/multipath-tools/AUTHOR -rw-r--r--    1 root    root            25284 Nov 11  2005 /usr/share/doc/packages/multipath-tools/COPYING -rw-r--r--    1 root    root              195 Jun 30 16:25 /usr/share/doc/packages/multipath-tools/ChangeLog -rw-r--r--    1 root    root               15 Jun 30 16:25 /usr/share/doc/packages/multipath-tools/README -rw-r--r--    1 root    root             9238 Jun 30 16:25 /usr/share/doc/packages/multipath-tools/multipath.conf.annotated -rw-r--r--    1 root    root             1499 Jun 30 16:25 /usr/share/doc/packages/multipath-tools/multipath.conf.synthetic -rw-r--r--    1 root    root              424 Jun 30 16:26 /usr/share/man/man8/devmap_name.8.gz -rw-r--r--    1 root    root              544 Jun 30 16:26 /usr/share/man/man8/kpartx.8.gz -rw-r--r--    1 root    root             2048 Jun 30 16:26 /usr/share/man/man8/mpath_prio_alua.8.gz -rw-r--r--    1 root    root              979 Jun 30 16:26 /usr/share/man/man8/multipath.8.gz -rw-r--r--    1 root    root              489 Jun 30 16:26 /usr/share/man/man8/multipathd.8.gz drwx------    2 root    root                0 Jun 30 16:26 /var/cache/multipath    

小技巧

存储添加映射或者做了修改,主机不用重新启动的方法   echo 1 > /sys/class/fc_host/host1/issue_lip   echo 1 > /sys/class/fc_host/host2/issue_lip   echo "- - -" > /sys/class/scsi_host/host1/scan   echo "- - -" > /sys/class/scsi_host/host2/scan     重启服务,让配置文件生效的方法:    1.     Stop the multipathd service.    2.     Clear old multipath bindings by entering /sbin/multipath -F    3.      Create new multipath bindings by entering /sbin/multipath -v2 -l Start the multipathd service. //更改配置文件后需要做上面的操作才可以让配置文件的更改生效。   如果连接一切都正常,但是suse在操作系统下看不到磁盘。这时可能需要重新启动存储系统。