一. 何为session
用户使用网站的服务,基本上需要浏览器和web服务器进行多次交互,web服务器如何知道哪些请求是来自哪个会话的?
具体方式为:在会话开始时,分配一个唯一的会话标识(sessionId),通过cookie把这个标识告诉浏览器,以后每次请求的时候,浏览器都会带上这个会话标识来告诉web服务器请求是属于哪个会话的。如果遇到禁用cookie的情况,一般的做法就是把这个会话标识放到url的参数中。
二. 问题
因为会话信息保存在单机上,当我们的应用服务器从一台变成两台后,我们就会遇到session的问题了!
如下图所示,当我们第一次访问网站时请求落到了左边的服务器,那么我的session就创建在左边的服务器上了,如果我们不做处理,就不能保证接下来的请求每次都落在同一边的服务器上了,这就是session问题。
三. 解决办法:
1. session sticky
在web服务器变成多台后,如果我们可以保证同一个会话请求都能在同一个web服务器上处理,那么对于这个会话个体来说,和单机的情况是一样的。这就需要负载均衡器能够根据每次请求的会话标识来进行请求转发。
有何问题:
① 如果有一台web服务器宕机或重启,那么这台机器上的会话数据会丢失
② 负载均衡器变成了一个有状态的结点,要保存会话到具体web服务器的映射,要消耗一定的内存。
2.session replication
web服务器之间增加了会话数据的同步,通过同步就保证了不同web服务器之间的session数据一致,一般的应用容器都支持这种方式。
问题:
① 只要session数据有变化,就需要将数据同步到其他机器上,会带来一定的网络带宽开销
② 每台web服务器都要保存所有的session数据,如果整个集群session数很多的话,对内存资源消耗较大。
该方案不适合集群机器较多的场景。
3.session数据集中存储
把session数据集中存储起来,然后不同的web服务器从相同的地方来获取session,存储session数据的方式可以为数据库,也可以使用其他分布式存储系统。
问题:
① 获取session存在延时和不稳定性,不过我们的通信基本在内网,问题不大。
② 如果存储session的机器或集群发生问题,就会影响到应用。
当集群规模较大时,session数较多时,该方案可以考虑。
4.cookie based
该方案通过cookie来传递session数据,即把session数据存在cookie中
问题:
① cookie有长度限制,这也就会限制session数据的长度
② 安全性,cookie的数据保存在客户端,这就存在安全性的问题,我们需要对写入cookie的session数据做加密处理
③ 带宽消耗, 客户端每次都要带着session过来,会消耗一定网络资源
④ 性能影响,每次http请求和响应都带有session数据,对web服务器来说,在同样的处理情况下,响应的结果输出越少,支持的并发请求就会越多。
综上方案都是解决session问题的方案,对于大型网站来说,session sticky和session集中管理是比较好的方案。