如何自己实现TCP负载均衡

时间:2022-06-28 10:18:07

前言

前一段时间我们的服务器经常遭受黑客攻击,真是让人不得安宁。于是本人根据自身情况实现了一套TCP负载均衡。这里也不罗嗦什么其他三方插件,比如后来的Nginx也很强大支持TCP,还有什么HA,有兴趣的可以了解了解。直入话题。

如何实现

*只有将复杂的策略下沉到服务端,才能根本上解决扩展性的问题*

增加一个http接口,将客户端的“IP配置”与“均衡策略”放到服务端:

client每次访问tcp-server前,先调用一个新增的get-tcp-ip接口,对于client而言,这个http接口只返回一个tcp-server的ip,这个http接口,实现的是原client的ip均衡策略,拿到tcp-server的ip后,和原来一样向tcp-server发起TCP长连接。

这样的话,扩展性问题就解决了。

如果原有IP发生变化,只需要修改get-tcp-ip接口的配置 ,如果新增IP,也是修改get-tcp-ip接口的配置,如果负载均衡策略变化,需要升级客户端。

然而,一个问题产生了,如果所有IP放在客户端,当有一个IP挂掉的时候,client可以再换一个IP连接,保证可用性,而get-tcp-ip接口只是维护静态的tcp-server集群IP,对于这些IP对应的tcp-server是否可用,是完全不知情的,怎么办呢?

tcp-server状态上报来解决:

get-tcp-ip接口怎么知道tcp-server集群中各台服务器是否可用呢,tcp-server主动上报是一个潜在方案,如果某一个tcp-server挂了,则会终止上报,对于停止上报状态的tcp-server,get-tcp-ip接口,将不返回给client相应的tcp-server的外网IP。这样好了么?不行,状态上报解决了tcp-server高可用的问题,但这个设计犯了一个“反向依赖”的耦合小错误:使得tcp-server要依赖于一个与本身业务无关的web-server。

tcp-server状态拉取:
更优的方案是:web-server通过“拉”的方式获取各个tcp-server的状态,而不是tcp-server通过“推”的方式上报自己的状态。这样的话,每个tcp-server都独立与解耦,只需专注于资深的tcp业务功能即可。高可用、负载均衡、扩展性等任务由get-tcp-ip的web-server专注来执行。

另外,将负载均衡实现在服务端,还有一个好处,可以实现异构tcp-server的负载均衡,以及过载保护,静态实施:web-server下的多个tcp-server的IP可以配置负载权重,根据tcp-server的机器配置分配负载(nginx也有类似的功能);动态实施:web-server可以根据“拉”回来的tcp-server的状态,动态分配负载,并在tcp-server性能极具下降时实施过载保护。

通过上面解说,想必大家很清楚如何实现,至于怎么实现IP分配,这是业务上的事情,每个公司实现方式不一样。希望这篇速文对大家有所帮助。