实现统计在线用户的几种方式

时间:2024-03-03 18:27:45

最近在考虑做个统计在线用户的功能。以前也做过,用的一些比较简单的方法,但是缺点也很明显:精确统计和服务器、数据库压力之间要做出平衡。
所以想找一个既能精确统计又能不占用太多服务器资源的方法。先说说一些平常的做法:

一,每次用户操作更新其在线时间

这个方法很直接,在用户表里加一个字段update_time,每次用户进行操作,都更新这个字段为当前时间,一般是在一个被所有Action继承的基类里写这个操作。
然后定义一个过期时间,比如10分钟,表示10分钟没进行任何操作的用户默认为不在线。这样,统计当前在线用户的sql语句大概是这样

  1. select count(*) from think_user where update_time>now()-10*60
复制代码

优点:实现简单,通俗易懂
缺点:1,对“在线”的定义模糊,万一用户看一篇文章时间比较长,10分钟内没进行任何操作,他就被忽略了;2,如果user表数据量很大,那效率将极差

二,将在线用户单独放入一张表

对于方法一的改进。新建一张表think_inline,字段有user_id、update_time,每次用户操作时,先判断表里有没有该用户的记录,没有则新增,有就更新update_time。
并同时加上删除失效数据操作

  1. delete from think_inline where update_time<now()-10*60
复制代码

这样,统计在线就可以直接count这张表就行了。而且这表的数据量不会很大(至少要比用户表小的多)

优点:减少数据库压力
缺点:仍然对“在线”的定义不准确

三,用JS定时器

这个方法是综合了一和二。新建一张表think_inline,也是在基类中定义每次用户操作时更新时间,参考二的做法。
不同之处是,在每个html模板里,加上一个js定时器,setInterval(\'updateTime\', 10*3600);每隔10分钟发送一次ajax请求,更新update_time字段。这样,即使用户在一个页面停留时间过长,也不会被误认为不在线 了。并且可以通过减少请求的间隔,来增加精确度,当然了,对服务器的压力就更大了。

优点:对在线的判断较为准确
缺点:仍然不能既精确又不增加服务器压力,必须在两者之间进行取舍。

四,使用TP的SessionDb驱动进行最优化设计


这也就是网上有人说的session存入数据库的方法,这种方法优点很多。目前,LZ就是用的这个。
具体做法是。。。有50个评论,我就公布,当然了,跟百度的那些复制粘贴的例子不一样,会有深入解析哦!
没多少人看啊,先写一些。

1,为什么要将session存入数据库?

session是存储在服务器的一组临时数据。一般情况下,我们在做用户登录时,会 将用户数据存入session。这样,在任何页面都可以方便调用,而且每个客户端会产生唯一的session_id,不会混肴。并且在关闭浏览器后,服务 器会有session回收机制,自动删除过期session。

这是session的优点:唯一性、方便调用、不会过多占用资源。但是也有缺点:在客户端是以cookie方式保存的,禁用cookie就没用了。

那么,服务器是如何存放session的呢?他是默认将session以文件的方式保存在硬盘上的。可是,对于我们码农来说,操作数据库要比读文件方便的多,并且可以对session数据进行各种操作。

而统计在线用户人数就是通过统计有多少条session记录来实现的。

2,如何把session存入数据库?


TP的SessionDb驱动就实现了这个功能。原理就是通过改写PHP默认的session操作来实现,核心函数session_set_save_handler(),有兴趣的可以研究一下。该驱动将session的增、读、取、和删都放入了数据库。
使用方法也很简单:1,建表,驱动的注释里的sql语句运行下就好
2,添加配置:

  1. //Session配置
  2.     \'SESSION_TYPE\'            => \'db\',            //数据库存储session
  3.     \'SESSION_TABLE\'            => \'think_session\',    //存session的表
  4.     \'SESSION_EXPIRE\'        => 600,                //session过期时间
复制代码

这样,只要我们在程序里使用了session()函数,数据库里就会有记录。

3,利用数据库session实现统计在线用户


1,统计在线总人数

  1. $map = array(\'session_expire\'=>array(\'gt\',NOW_TIME));
  2.         $inline = D(\'Session\')->where($map)->count();
复制代码

2,统计游客(未登录)人数

  1. $map = array(\'session_expire\'=>array(\'gt\',NOW_TIME),\'session_data\'=>array(\'eq\',\'\'));
  2.         $huiyuan = D(\'Session\')->where($map)->count();
复制代码

3,统计会员(已登录)人数

  1. $map = array(\'session_expire\'=>array(\'gt\',NOW_TIME),\'session_data\'=>array(\'neq\',\'\'));
  2.         $huiyuan = D(\'Session\')->where($map)->count();
复制代码

4,判断一个用户是否在线。
在用户表里新增一个字段:session_id。
(1)在登录操作里,保存该用户的session_id,

  1. $session_id = session_id();
  2.   D(\'User\')->where(array(\'id\'=>$user_id))->save(\'session_id\'=>$session_id);
复制代码

(2)检查session表里是否存在该session_id,未过期并且有值,

  1. $map = array(\'session_id\'=>$session_id,\'session_expire\'=>array(\'gt\',NOW_TIME),\'session_data\'=>array(\'neq\',\'\'));
  2.         $res = D(\'Session\')->where($map)->find();
  3. if($res){dump(\'该用户在线。\')}else{dump(\'该用户不在线。\')}
复制代码


码字太麻烦啦,先写这么多,后面总结该方法的几大优点以及注意事项。

4,总结


1,实现步骤:用户表新增字段保存session_id;使用TP的SessionDb驱动。是不是很简单?

2,优点
(1)比上面三种方法对数据库和服务器的压力都小,操作简单
(2)能够区分在线用户是会员还是游客(session_data字段是否有值),discuz就是这样做的
(3)可以通过删除某用户的session记录,实现将其“踢下线”的功能

3,缺点
(1)仍然不能精确统计,只能说,XX秒内在线多少人

4,注意事项
(1)由于该方法的SessionDb驱动必须使用session()函数才能触发,所以必须配置自动开启session(默认就是开启)。TP在执行流程里会使用session()函数,所以你什么都不写,session数据也会存入数据库。
(2)因为数据库的session数据是不会自己删除的,所以对于过期的数据,必须调用session()方法才会删。
这也就意味着,如果你的网站一个人都没有访问,那么数据库的过期session记录会一直存在。

也就是由于这种机制,对于一些突发事件(用户直接X浏览器、直接关机、发生地震……),在其关闭浏览器的一段时间(session过期时间)后,其他用户对网站的访问,会触发session回收,删除过期记录。所以,就不怕统计出来的数据不准确了。
当然了,就算没人访问,你也可以在count时加上session_expire>time()来统计。

但是也有误差,就是session过期时间,5分钟后过期,就有5分钟的误差。时间设的越小,对数据库的操作就越频繁;越大,精确度就越低。

(3)这个session过期时间就意味着,如果用户5分钟内不进行任何操作,其就会自动退出登录。所以,为了用户体验好,请加上cookie自动登录功能。目前官网就是这么做的。

(4)评论里有人提到,验证码也会存入session,所以我们判断的时候,就不能值统计有值的记录了。
需要先获取有值的数据,再判断里面有没有保存用户信息的参数名。虽然session_data字段是用二进制存储的,但是查询出来就是一个字符串。
比如,我们用的user下标来保存的用户信息,

  1. session(\'user\',$data);//用户登录信息
  2. //获取真实会员数
  3. //查询有值的session记录
  4. $list = D(\'Session\')->where(array(\'session_data\'=>array(\'NEQ\',\'\'),\'session_expire\'=>array(\'lt\',NOW_TIME)))->select();
  5. //判断值里是否有会员标识
  6. foreach($list as $k=>$value){
  7.   if(strpos($value[\'session_data\'],\'user\') === false){
  8.                 $count++;
  9.             }
  10. dump($count);//真实会员人数
  11. }
复制代码


(5)由于每种浏览器都有各自的session机制,所以,如果一个人在一台电脑上同时开了5种浏览器,则数据库会保存5条不同的记录
实际使用时,仍需要考虑搜索引擎的误差。在其抓取我们的页面时,也会产生session。

五,最终结论

由于HTTP协议的限制:请求完成后就会断开与客户端的连接。所以实际上,

我们根本无法精确而实时地统计在线人数


尽管有各种各样的方法来增加统计的精确度,然而都是治标不治本。

唯有放弃HTTP协议,使用“长连接”的链接方式,才能精确判断用户在还是离