nginx负载均衡ip-hash算法

时间:2022-08-25 16:49:13

我们指出:网络负载均衡本质上是分布式业务中调度系统的一种实现。作为网络请求分配的控制者,负载均衡器起着至关重要的作用。考虑到在任何一个网络请求中,都有一个源地址和目标地址(源IP和目标IP)。这样,在负载均衡器中,我们就可以利用这两个IP,通过一种散列算法把请求分配到不同的服务器上。这种算法就是目标散列调度(利用目标IP)和源地址散列调度(利用源IP)。这两种算法为静态算法。

  下面我们分别简要讲述一下。

  目标地址散列调度(Destination Hashing Scheduling)算法

  目标地址散列调度(Destination Hashing Scheduling)算法的基本原理是:此算法根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载的,则将请求发送到该服务器,否则返回空。这里我们设定某个服务器的连接数目大于2倍的权值,则表示此服务器已超载。

  目标地址散列算法流程

  假设有一组服务器S = {S0, S1, ..., Sn-1},W(i)表示服务器Si的权值,C(i)表示服务器Si的当前连接数。ServerNode[]是一个Hash表。此表大小就是服务器的数目,也可根据算法模块中的具体条件修改。

  算法的初始化是将所有服务器顺序、循环地放置到ServerNode表中。

      n = ServerNode[hashkey(dest_ip)]; 
  if ( (n is dead) OR (W(n) == 0) OR (C(n) > 2*W(n))) then 
  return NULL; 
  return n; // 如果一切OK

  上面的算法中,hashkey()为散列函数。在实现时,一般采用素数乘法Hash函数,通过乘以素数使得散列键值尽可能地达到较均匀的分布。

  Hashkey实现如下:

      static inline unsigned hashkey(unsigned int dest_ip) 
  { 
  return (dest_ip* 2654435761UL) & HASH_TAB_MASK; 
  } 
  其中,2654435761UL是2到2^32 (4294967296)间接近于黄金分割的素数, 
  (sqrt(5) - 1) / 2 = 0.618033989 
  2654435761 / 4294967296 = 0.618033987

  源地址散列调度(Source Hashing Scheduling)算法

  源地址散列调度(Source Hashing Scheduling)算法的基本原理是:此算法根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载的,则将请求发送到该服务器,否则返回空。这里我们设定某个服务器的连接数目大于2倍的权值,则表示此服务器已超载。、

  可以看出,这种方式和目标地址散列调度方法是类似的,唯一的区别是以源地址作为散列键。

  源地址散列算法流程

  源地址散列算法流程和目标地址散列算法流程类似,采用的散列函数也一样。唯一不同的是,需要将请求的目标IP地址换成请求的源IP地址,所以这里不再赘述。

  总结

  源地址散列调度和目标散列调度属于两种静态的调度算法,在实际应用中,这两种调度算法可以结合使用在防火墙集群中,它们可以保证整个系统的唯一出入口。