http://chrinux.blog.51cto.com/6466723/1195206
- 集群并不是一个全新的概念,其实早在七十年代计算机厂商和研究机构就开始了对集群系统的研究和开发。由于主要
- 用于科学工程计算,所以这些系统并不为大家所熟知。直到Linux集群的出现,集群的概念才得以广为传播。集群系统主
- 要分为高可用(High Availability)集群,简称 HA 集群,和高性能计算(High Perfermance Computing)集群,
- 简称 HPC 集群。
- 计算机集群简称集群是一种计算机系统, 它通过一组松散集成的计算机软件或硬件连接起来高度紧密地协作完成计
- 算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,
- 但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个
- 计算机,比如工作站或超级计算机性能价格比要高得多。
- 负载均衡集群LB: Load balancing clusters
- 高可用性集群HA: High-availability (HA) clusters
- 高性能计算集群HP: High-performance (HPC) clusters
- 网格计算 Grid computing
⑴、负载均衡集群-LB
- 负载均衡集群运行时,一般通过一个或者多个前端负载均衡器,将工作负载分发到后端的一组服务器上,从而达到整
- 个系统的高性能和高可用性。这样的计算机集群有时也被称为服务器群(Server Farm)。 一般高可用性集群和负载均
- 衡集群会使用类似的技术,或同时具有高可用性与负载均衡的特点。linux虚拟服务器(LVS)项目在linux操作系统上
- 提供了最常见的负载均衡软件。
- LB在提供负载均衡的时候,如果提供的是DNS负载均衡,由于DNS缓存服务存在的
- 机制,造成负载均衡的效果会大打折扣。所以在此出现了调度方法,常用的有两个调度
- 方法:
- RR:Round Robin 论调
- WRR:Weight Round Robin 加权论调
- 负载均衡:以提高服务的并发能力为集群的重点的集群
- 衡量标准:并发处理能力
- 一般是指当集群中有某个节点失效的情况下,其上的任务会自动转移到其他正常的节点上。还指可以将集群中的某节
- 点进行离线维护再上线,该过程并不影响整个集群的运行。
- 高可用集群:为了保证服务一直在线的高可用能力的集群
- 衡量标准:可用性=在线时间/(在线时间+故障处理时间)
⑶、高性能计算集群-HP
- 高性能计算集群采用将计算任务分配到集群的不同计算节点而提高计算能力,因而主要应用在科学计算领域。比较流
- 行的HPC采用Linux操作系统和其它一些免费软件来完成并行运算。这一集群配置通常被称为Beowulf集群。这类集群通
- 常运行特定的程序以发挥HPC cluster的并行能力。这类程序一般应用特定的运行库, 比如专为科学计算设计的MPI库。
- HPC集群特别适合于在计算中各计算节点之间发生大量数据通讯的计算作业,比如一个节点的中间结果或影响到其它
- 节点计算结果的情况。
- 高性能处理集群:利用的是分布式存储:分布式文件系统,分布式文件系统把一个大任务切割为小任务、分别进行处
- 理
⑷、网格计算
- 网格计算或网格集群是一种与集群计算非常相关的技术。网格与传统集群的主要差别是网格是连接一组相关并不信任
- 的计算机,它的运作更像一个计算公共设施而不是一个独立的计算机。还有,网格通常比集群支持更多不同类型的计算机
- 集合。
- 网格计算是针对有许多独立作业的工作任务作优化,在计算过程中作业间无需共享数据。网格主要服务于管理在独立
- 执行工作的计算机间的作业分配。资源如存储可以被所有结点共享,但作业的中间结果不会影响在其他网格结点上作业的
- 进展。
- 1、负载均衡器设备类型:分为硬件和软件两种
- 硬件设备:
- F5的BIG IP负载均衡器
- Citrix的Netscaler负载均衡器
- A10
- 软件:分为基于四层和七层的两种类型
- 四层:
- lvs是一个开源的软件,由毕业于国防科技大学的章文嵩博士于1998年5月创立的,可以实现LINUX平台下的简单负载均衡。LVS是Linux Virtual Server的缩写,意思是Linux虚拟服务器
- 。
- 七层:反向代理
- Nginx:支持http,pop3,smtp,imap
- haproxy:支持http,tcp(mysql,smtp)
- 由于硬件设备价格比较高,动则上万、几十万刀,所以一般的小公司所使用的还是基于软件的架构方式来实现集群的。
- 当然,只要掌握了linux下基于软件的集群架构,其他基于硬件的架构配置也都大同小异,由于硬件的缺乏、嘿嘿--目
- 前还是小菜鸟一个,公司内部的设备还没见过是神马模样!!所以在此就着重介绍一下我们linux系统下基于LVS架构的
- 集群的搭建,当然,这也是我们作为linux运维人员必须掌握的重中之重~~是吧!好了,废话不扯那么多了~下面我们进
- 入正题吧!自己理解,如有错误还望各位大神们不吝赐教~~
- lvs是一个开源的软件,由毕业于国防科技大学的章文嵩博士于1998年5月创立的,可以实现LINUX平台下的简单负载均
- 衡。LVS是Linux Virtual Server的缩写,意思是Linux虚拟服务器。
- 这是国人在开源上作出的最大贡献~我们为此骄傲、自豪!嘿嘿——说多了,中国在开源上面的贡献好像还真是少之
- 又少啊~~望各位大神们多做贡献,天朝还是可以出现大神的!-唠多了,下面接着咱们的VLS。
- LVS是linux系统上的一种机制,类似于iptables似,其相关属性也是通过与iptables命令类似的方式定义的,
- 等会会详细介绍。LVS是工作于内核上的,通过内核来提供工作,其工作空间在iptables的INPUT链上,当客户端请求到
- 达INPUT链上以后,通过LVS的验证如果是关于lvs的请求,则在此直接修改目标地址,然后通过postrouting链传送给
- 其定义的server!
- 注意:上面提到LVS其实是工作在iptables的INPUT和POSTROUTING链上的,所以在此系统上iptables
- 和LVS不能同时存在。
- ipvsadm:管理集群服务的命令行工具,工作于用户空间
- ipvs:为lvs提供服务的内核模块,工作于内核空间
- 在linux内核2.4.23之前的内核中模块默认是不存在的,需要自己手动打补丁,然后把此模块编译进内核才可以正常
- 使用。
- 为了便于表述下面的内容,在此插几句关于相关服务和名词的定义
- Director:复制调度集群的主机
- VIP:Virtual IP,向外提供服务的IP
- RIP:real IP,内部真的提供服务的主机IP
- DIP:向内部的IP通信的IP,在Director主机上
- CIP:客户端IP
- 优点:多目标的NAT转换,能够实现负载均衡,一个Director最多额可以提供10个Real Server主机。
- 特点和要求:
- 1、LVS上面需要双网卡:DIP和VIP
- 2、内网的Real Server主机的IP必须和DIP在同一网络中,并且其网关需要指向DIP的地址
- 3、RIP地址都是私有IP地址,仅用于各个集节点之间通信
- 4、Director位于client和Real Server之间,并负责处理所有进站、出战的通信。
- 5、Real Server必须将网关指向DIP
- 6、支持端口映射
- 7、通常应用在较大规模应用场景中,但是Director易成为整个架构的瓶颈。
- 1、架构组成:
- 每个Real Server上都有两个IP:VIP和RIP,但是VIP是隐藏的,就是不能提高解析等功能,只是用来做请求回复
- 的源IP的,Director上只需要一个网卡,然后利用别名来配置两个IP:VIP和DIP
- 2、Director在接受到外部主机的请求的时候转发给Real Server的时候并不更改目标地址,只是通过arp解析的
- MAC地址进行封装然后转给Real Server,Real Server在接受到信息以后拆除MAC帧封装,然后直接回复给CIP。
- 3、企业中最常用的就是DR
- 特点和要求:
- 1、各个集群节点必须和Director在同一个物理网络中
- 2、RIP地址不能为私有地址,可以实现便捷的远程管理和监控
- 3、Director仅仅负责处理入站请求,响应报文则由Real Server直接发往客户端
- 4、集群节点Real Server 的网关一定不能指向DIP,而是指向外部路由
- 5、Director不支持端口映射
- 6、Director能够支持比NAT多很多的Real Server
- 1、架构
- Director必须有两个IP:VIP和DIP,在向外部进行转发的时候CIP和VIP不能更改,而是在数据报文的外面加层
- 封装(S:DIP,D:RIP),然后通过Internet传送给外部的Real Server,Real Server接收到请求以后,先拆除第一
- 层封装后拆除第二层封装,然后把响应数据直接传输给Client
- 2、特性:
- 1、集群节点可以跨越Internet
- 2、Director的VIP和RIP必须为公网IP
- 3、Director仅处理入站请求,响应报文则由Real Server直接发往客户端
- 4、Real Server的网关不能指向Director
- 5、只有支持隧道协议功能的OS才能作为Real Server
- 6、不支持端口映射
- 静态调度:
- 1、轮叫调度: Round-Robin Scheduling,简称RR,轮叫调度就是以轮叫的方式请求不同的服务器,算法的优点是其简洁性,它无需记录当前所有连接的状态,所以它是一种无状态调度。轮叫调度算法假设所有服务器处理性能均相同,不管服务器的当前连接数和响应速度。该算法相对简单,不适用于服务器组中处理性能不一的情况,而且当请求服务时间变化比较大时,轮叫调度算法容易导致服务器间的负载不平衡。
- 2、加权轮叫调度(Weighted Round-Robin Scheduling),加权轮叫,简称WRR。该算法可以解决服务器间性能不一的情况,它用相应的权值表示服务器的处理性能,服务器的缺省权值为1。假设服务器A的权值为1,B的权值为2,则表示服务器B的处理性能是A的两倍。加权轮叫调度算法是按权值的高低和轮叫方式分配请求到各服务器。权值高的服务器先收到的连接,权值高的服务器比权值低的服务器处理更多的连接,相同权值的服务器处理相同数目的连接数。
- 3、源地址散列调度(Source Hashing Scheduling),源地址散列,简称SH。源地址散列调度算法正好与目标地址散列调度算法相反,它根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。它采用的散列函数与目标地址散列调度算法的相同。
- 通过源地址hash,使来自于同一个客户端的请求,都转发给同一个Real Server,这样来保证cookie与session进行
- 会话绑定。
- 4、目标地址散列调度(Destination Hashing Scheduling),目标地址散列,简称DH。目标地址散列调度算法先根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空,主要应用于缓存服务器。
- 动态调度
- 1、最小连接调度(Least-Connection Scheduling),最少链接,简称LC。该调度是把新的连接请求分配到当前连接数最小的服务器。最小连接调度是一种动态调度算法,它通过服务器当前所活跃的连接数来估计服务器的负载情况。调度器需要记录各个服务器已建立连接的数目,当一个请求被调度到某台服务器,其连接数加1;当连接中止或超时,其连接数减1。
- 计算当前RealServer 的负载情况计算方法:active*256+inactive,谁的数值小就选择谁!
- 2、加权最小连接调度(Weighted Least-Connection Scheduling),加权最少链接,简称WLC。加权最小连接调度是最小连接调度的超集,各个服务器用相应的权值表示其处理性能。服务器的缺省权值为1,系统管理员可以动态地设置服务器的权值。加权最小连接调度在调度新连接时尽可能使服务器的已建立连接数和其权值成比例。计算当前Real Server 的负载情况计算方法:(active*256+inactive)/weight,谁小选择谁来响应服务。
- 3、基于局部性的最少链接(Locality-Based Least Connections Scheduling),简称LBLC,"基于局部性的最少链接" 调度算法是针对目标IP 地址的负载均衡,目前主要用于Cache 集群系统。该算法根据请求的目标IP 地址找出该目标IP 地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用"最少链接"的原则选出一个可用的服务器,将请求发送到该服务器。
- 4、带复制的基于局部性最少链接(Locality-Based Least Connections with Replication Scheduling),简称LBLCR。"带复制的基于局部性最少链接"调度算法也是针对目标IP 地址的负载均衡,目前主要用于Cache 集群系统。它与LBLC 算法的不同之处是它要维护从一个目标IP 地址到一组服务器的映射,而LBLC 算法维护从一个目标IP 地址到一台服务器的映射。该算法根据请求的目标IP 地址找出该目标IP 地址对应的服务器组,按"最小连接"原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按"最小连接"原则从这个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。
- 5、最短期望延迟(Shortest Expected Delay Scheduling),简称SED,分配一个接踵而来的请求以最短的期望的延迟方式到服务器,
- 计算当前realserver 的负载情况计算方法:(active+1)*256/weight=overhead。
- 6、永不排队(Never Queue),又称最小队列调度,简称NQ。分配一个接踵而来的请求到一台空闲的服务器,此服务器不一定是最快的那台,如果所有服务器都是繁忙的,它采取最短的期望延迟分配请求。
- ⑴、管理集群服务命令
- 添加集群:-A
- 格式:ipvsadm -A|E -t|u|f service-address [-s scheduler算法]
- -t:tcp协议的集群
- -u:udp协议的集群
- -f或--fwmark-service:基于防火墙标记的集群服务
- fg:添加一条基于http的集群
- ipvsadm -A -t 172.16.7.1:80 -s rr
- 修改集群:-E
- fg:修改上面增加的集群算法为wrr
- ipvsadm -A -t 172.16.7.1:80 -s wrr
- 删除集群:-D
- fg:删除上面增加的集群
- ipvsadm -D -t 172.16.7.1:80
- 清空集群计数器:-Z
- ipvsadm -Z
- 清空所有集群的配置:-C
- ipvsadm -C
- 在集群中添加RS:-a
- 格式:ipvsadm -a -t|u|f service-address -r server-address [-g|i|m(LVS的类型)] [-w weight]
- -t|u|f service-address:事先定义好的某集群服务
- -r service-address:某RS的地址,在NAT模型中,可以使用IP:PORT实现端口映射
- [-g|i|m] :LVS 类型
- -g:DR类型
- -i:TUN类型
- -m:NAT
- [-w weight]:定义服务器权重
- fg:在集群172.16.7.1:80上增加RS1:172.16.7.2;RS2172.16.7.3,并定以为NAT模式,并且定义权重
- ipvsadm -A -t 172.17.7.1:80 -s wrr
- ipvsadm -a -t 172.17.7.1:80 -r 172.16.7.2 -m -w 2
- ipvsadm -a -t 172.17.7.1:80 -r 172.16.7.3 -m -w 1
- 修改集群中的RS:-e
- 格式:ipvsadm -e -t|u|f service-address -r server-address [-g|i|m(LVS的类型)] [-w weight]
- fg:修改上面的RS2的权重为3
- ipvsadm -e -t 172.17.7.1:80 -r 172.16.7.3 -m -w 3
- 删除集群中的RS:-d
- 格式:ipvsadm -d -t|u|f service-address -r server-address
- fg:删除上面的RS2
- ipvsadm -d -t 172.17.7.1:80 -r 172.16.7.3
- -n:不反解IP地址,以数字的形式显示主机地址和端口
- -c:显示当前的ipvs连接状态的
- --stats :显示统计信息
- --rate:显示速率信息
- --timeout:显示tcp、tcpfin、udp超时时间长度
- --daemon:显示进程的
- --sort:根据端口排序显示,默认是升序
- --persitent-conn 显示持久连接