(1).查看网络(Network)运行状态相关工具
1)nload监控总体带宽使用情况
nload需要自己安装,而且在安装前需要安装epel-release
[root@youxi1 ~]# yum -y install epel-release [root@youxi1 ~]# yum -y install nload
安装一个httpd,使用ab命令测试
[root@youxi1 ~]# yum -y install httpd [root@youxi1 ~]# nload //出现的页面会实时刷新,后面可以跟-u <单位>来指定流量的单位,也支持h人类易读 Device ens33 [192.168.5.101] (1/2): //当前是哪一块网卡,可以按<Enter>切换 ================================================================================ Incoming: //进入当前网卡的流量 Curr: 952.00 Bit/s //当前流量 Avg: 1.52 kBit/s //平均流量 Min: 944.00 Bit/s //最小流量 Max: 19.27 kBit/s //最大流量 Ttl: 18.99 MByte //流量总和 Outgoing: //从当前网卡出去的流量 Curr: 7.84 kBit/s Avg: 8.46 kBit/s Min: 3.53 kBit/s Max: 41.29 kBit/s Ttl: 490.19 kByte //如果想要退出按q //打开另一个窗口,使用ab命令测试 [root@youxi1 ~]# ab -n 1000 -c 2 http://www.baidu.com/index.html
结果如下:
2)nethogs找出使用带宽最多的进程
一样需要下载安装,不过这里需要下载rpm包
[root@youxi1 ~]# wget http://dl.fedoraproject.org/pub/epel/7/x86_64/Packages/n/nethogs-0.8.5-1.el7.x86_64.rpm [root@youxi1 ~]# yum -y install nethogs //会有依赖,所以我直接使用yum安装
使用nethogs查看使用带宽最多的进程
[root@youxi1 ~]# nethogs //这个也是实时刷新的,按q退出 Ethernet link detected Waiting for first packet to arrive (see sourceforge.net bug 1019381) NetHogs version 0.8.5 PID USER PROGRAM DEV SENT RECEIVED 1416 root sshd: root@pts/0 ens33 0.147 0.059 KB/sec ? root unknown TCP 0.000 0.000 KB/sec TOTAL 0.147 0.059 KB/sec //打开另一个窗口下载一个文件进行测试 [root@youxi1 ~]# wget http://issuecdn.baidupcs.com/issue/netdisk/yunguanjia/BaiduNetdisk_5.5.3.exe
结果如下:
可以看到PID为1620的wget进程流量最多。
(2).网络相关调优
1)网卡绑定技术(Bonding)
网卡绑定也称作"网卡捆绑",就是使用多块物理网卡虚拟成为一块网卡,以提供负载均衡或者冗余,增加带宽的作用。当一个网卡坏掉时,不会影响业务。这个聚合起来的设备看起来是一个单独的以太网接口设备,也就是这几块网卡具有相同的IP地址而并行链接聚合成一个逻辑链路工作。这种技术在Cisco等网络公司中,被称为Trunking和Etherchannel 技术,在Linux的内核中把这种技术称为bonding。
负载均衡:对于bonding的网络负载均衡是我们在文件服务器中常用到的,比如把三块网卡,当做一块来用,解决一个IP地址,流量过大,服务器网络压力过大的问题。为了解决同一个IP地址,突破流量的限制,毕竟网线和网卡对数据的吞吐量是有限制的。如果在有限的资源的情况下,实现网络负载均衡,最好的办法就是 bonding。
网络冗余:对于服务器来说,网络设备的稳定也是比较重要的,特别是网卡。在生产型的系统中,网卡的可靠性就更为重要了。在生产型的系统中,大多通过硬件设备的冗余来提供服务器的可靠性和安全性,比如电源。bonding 也能为网卡提供冗余的支持。把多块网卡绑定到一个IP地址,当一块网卡发生物理性损坏的情况下,另一块网卡自动启用,并提供正常的服务,即:默认情况下只有一块网卡工作,其它网卡做备份。
这里做一个主备模式的绑定,即一个网卡处于活跃状态,另一个处于备份状态,当活跃网卡down掉时,启用备份网卡。
首先需要将主机调整为双网卡(或者多网卡),重启network
[root@youxi1 ~]# systemctl restart network //重启是为了知道网卡名称,后面绑定需要用到网卡名称 [root@youxi1 ~]# ip a sh //可以看到我这里是ens33和ens38 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever inet6 ::1/128 scope host valid_lft forever preferred_lft forever 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000 link/ether 00:0c:29:e6:d6:27 brd ff:ff:ff:ff:ff:ff inet 192.168.5.101/24 brd 192.168.5.255 scope global noprefixroute ens33 valid_lft forever preferred_lft forever inet6 fe80::201:7257:85b:7dc8/64 scope link noprefixroute valid_lft forever preferred_lft forever 4: ens38: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000 link/ether 00:0c:29:e6:d6:31 brd ff:ff:ff:ff:ff:ff inet 192.168.5.130/24 brd 192.168.5.255 scope global noprefixroute dynamic ens38 valid_lft 1780sec preferred_lft 1780sec inet6 fe80::6993:89d:c392:b48e/64 scope link noprefixroute valid_lft forever preferred_lft forever
接着移动网卡配置文件,生成绑定配置文件
[root@youxi1 ~]# mkdir /network_bak //创建一个网卡备份目录 [root@youxi1 ~]# mv /etc/sysconfig/network-scripts/ifcfg-ens* /network_bak/ [root@youxi1 ~]# ls /network_bak/ //这个应该是我没有重启服务器,所以只有一个,最后我会重启服务器测试一下 ifcfg-ens33 [root@youxi1 ~]# nmcli connection add type bond ifname bond0 con-name bond0 miimon 100 mode active-backup primary ens33 ip4 192.168.5.101/24 连接“bond0”(678abe85-7b3f-4192-a372-1101579e0897) 已成功添加。 [root@youxi1 ~]# vim /etc/sysconfig/network-scripts/ifcfg-bond0 GATEWAY=192.168.5.2 //虽然生成了配置信息,但并不全,需要添加默认网关和DNS DNS1=192.168.5.2
nmcli说明:
add type bond ifname bond0 | 添加一个类型为bond,网卡名为bond0的设备。 其实在add和type之间还有一个隐藏参数[save {yes|no}],只不过默认是yes,所以可以不写。 |
con-name bond0 | 配置名称为bond0的链路 |
miimon 100 | 指定监控频率为100毫秒 |
mode active-backup | 指定模式为主备模式 |
primary ens33 | 指定主网卡为ens33 |
ip4 192.168.5.101/24 | 指定IP地址为192.168.5.101/24 |
将网卡ens33和ens38绑定到band0上,注意ens33和ens38的类型应该为bond-slave,表示bond的子接口。
[root@youxi1 ~]# nmcli connection add type bond-slave ifname ens33 master bond0 连接“bond-slave-ens33”(47689691-697a-4370-bb2f-e8de9adbff26) 已成功添加。 [root@youxi1 ~]# nmcli connection add type bond-slave ifname ens38 master bond0 连接“bond-slave-ens38”(a12c6f04-5b5a-4dee-adb5-b7eb0e71399c) 已成功添加。 [root@youxi1 ~]# ls /etc/sysconfig/network-scripts/ifcfg-bond* /etc/sysconfig/network-scripts/ifcfg-bond0 /etc/sysconfig/network-scripts/ifcfg-bond-slave-ens33 /etc/sysconfig/network-scripts/ifcfg-bond-slave-ens38
最后重启网络服务,使配置生效
[root@youxi1 ~]# systemctl restart network [root@youxi1 ~]# nmcli connection show --active //查看当前已激活的网络接口 NAME UUID TYPE DEVICE bond-slave-ens33 47689691-697a-4370-bb2f-e8de9adbff26 ethernet ens33 bond-slave-ens38 a12c6f04-5b5a-4dee-adb5-b7eb0e71399c ethernet ens38 bond0 678abe85-7b3f-4192-a372-1101579e0897 bond bond0 [root@youxi1 ~]# cat /proc/net/bonding/bond0 //查看band0当前状态 Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011) Bonding Mode: fault-tolerance (active-backup) Primary Slave: ens33 (primary_reselect always) Currently Active Slave: ens33 //当前使用的从接口 MII Status: up MII Polling Interval (ms): 100 Up Delay (ms): 0 Down Delay (ms): 0 Slave Interface: ens33 //从接口 MII Status: up //链接状态 Speed: 1000 Mbps Duplex: full Link Failure Count: 0 Permanent HW addr: 00:0c:29:e6:d6:27 Slave queue ID: 0 Slave Interface: ens38 MII Status: up Speed: 1000 Mbps Duplex: full Link Failure Count: 0 Permanent HW addr: 00:0c:29:e6:d6:31 Slave queue ID: 0
测试,将ens33的网络断开,然后再次查看bond0的状态
[root@youxi1 ~]# cat /proc/net/bonding/bond0 Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011) Bonding Mode: fault-tolerance (active-backup) Primary Slave: ens33 (primary_reselect always) Currently Active Slave: ens38 //可以看到有ens33变成了ens38 MII Status: up MII Polling Interval (ms): 100 Up Delay (ms): 0 Down Delay (ms): 0 Slave Interface: ens33 MII Status: down //ens33是down状态 Speed: Unknown Duplex: Unknown Link Failure Count: 1 Permanent HW addr: 00:0c:29:e6:d6:27 Slave queue ID: 0 Slave Interface: ens38 MII Status: up Speed: 1000 Mbps Duplex: full Link Failure Count: 0 Permanent HW addr: 00:0c:29:e6:d6:31 Slave queue ID: 0
重启之后依然有效,如下
[root@youxi1 ~]# cat /proc/net/bonding/bond0 Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011) Bonding Mode: fault-tolerance (active-backup) Primary Slave: ens33 (primary_reselect always) Currently Active Slave: ens38 MII Status: up MII Polling Interval (ms): 100 Up Delay (ms): 0 Down Delay (ms): 0 Slave Interface: ens38 MII Status: up Speed: 1000 Mbps Duplex: full Link Failure Count: 0 Permanent HW addr: 00:0c:29:e6:d6:31 Slave queue ID: 0 Slave Interface: ens33 MII Status: down Speed: Unknown Duplex: Unknown Link Failure Count: 0 Permanent HW addr: 00:0c:29:e6:d6:27 Slave queue ID: 0
(3).band类型下的七种模式(mode)
常用的模式mode是0、1、4、6这几种模式。具体如下:balance-rr (0) –轮询模式,负载均衡(bond默认的模式);active-backup (1) –主备模式(常用);balance-xor (2);broadcast (3);802.3ad (4) –聚合模式;balance-tlb (5);balance-alb (6)。
详细如下:
mode=0 默认是mode=0, 有高可用 (容错) 和负载均衡的功能, 需要交换机的配置,每块网卡轮询发包 (流量分发比较均衡),mode 0下bond所绑定的网卡的IP都被修改成相同的mac地址,如果这些网卡都被接在同一个交换机,那么交换机的arp表里这个mac地址对应的端口就有多个,那么交换机接受到发往这个mac地址的包应该往哪个端口转发呢?正常情况下mac地址是全球唯一的,一个mac地址对应多个端口肯定使交换机迷惑了。所以 mode0下的bond如果连接到交换机,交换机这几个端口应该采取聚合方式(cisco称为ethernetchannel),因为交换机做了聚合后,聚合下的几个端口也被捆绑成一个mac地址。若我们不配置,我们的解 决办法是,两个网卡接入不同的交换机即可。
mode=1 只有一个设备处于活动状态,当一个宕掉另一个马上由备份转换为主设备。mac地址是外部可见得,从外面看来,bond的MAC地址是唯一的,以避免switch(交换机)发生混乱。此模式只提供了容错能力;由此可见此算法的优点是可以提供高网络连接的可用性,但是它的资源利用率较低,只有一个接口处于工作状态,在有 N 个网络接口的情况下,资源利用率为1/N
mode=2 基于指定的传输HASH策略传输数据包。缺省的策略是:(源MAC地址 XOR 目标MAC地址) % slave数量。其他的传输策略可以通过xmit_hash_policy选项指定,此模式提供负载平衡和容错能力。
mode=3 在每个slave接口上传输每个数据包,此模式提供了容错能力,非常不常用。
mode=4 创建一个聚合组,它们共享同样的速率和双工设定。根据802.3ad规范将多个slave工作在同一个激活的聚合体下。外出流量的slave选举是基于传输hash策略,该策略可以通过xmit_hash_policy选项从缺省的XOR策略改变到其他策略。需要几个必要条件:ethtool支持获取每个slave的速率和双工设定;switch(交换机)支持IEEE 802.3ad Dynamic link aggregation;大多数switch(交换机)需要经过特定配置才能支持802.3ad模式。
mode=5 不需要任何特别的switch(交换机)支持的通道bonding。在每个slave上根据当前的负载(根据速度计算)分配外出流量。如果正在接受数据的slave出故障了,另一个slave接管失败的slave的MAC地址。该模式的必要条件:ethtool支持获取每个slave的速率。
mode=6 模式包含了balance-tlb(5)模式,同时加上针对IPV4流量的接收负载均衡(receive load balance, rlb),而且不需要任何switch(交换机)的支持。接收负载均衡是通过ARP协商实现的。bonding驱动截获本机发送的ARP应答,并把源硬件地址改写为bond中某个slave的唯一硬件地址,从而使得不同的对端使用不同的硬件地址进行通信。来自服务器端的接收流量也会被均衡。当本机发送ARP请求时,bonding驱动把对端的IP信息从ARP包中复制并保存下来。当ARP应答从对端到达 时,bonding驱动把它的硬件地址提取出来,并发起一个ARP应答给bond中的某个slave。使用ARP协商进行负载均衡的一个问题是:每次广播 ARP请求时都会使用bond的硬件地址,因此对端学习到这个硬件地址后,接收流量将会全部流向当前的slave。这个问题可以通过给所有的对端发送更新 (ARP应答)来解决,应答中包含他们独一无二的硬件地址,从而导致流量重新分布。当新的slave加入到bond中时,或者某个未激活的slave重新 激活时,接收流量也要重新分布。接收的负载被顺序地分布(round robin)在bond中最高速的slave上当某个链路被重新接上,或者一个新的slave加入到bond中,接收流量在所有当前激活的slave中全部重新分配,通过使用指定的MAC地址给每个 client起ARP应答。下面介绍的updelay参数必须被设置为某个大于等于switch(交换机)转发延时的值,从而保证发往对端的ARP应答 不会被switch(交换机)阻截。