实施反馈:系统整体慢,已被客户投诉。
系统部署大致如下:请求由F5转发到四个weblogic节点,四个节点分别部署在两台服务器上,数据库是Oracle。
诊断方法还是这个步骤:
1.诊断weblogic日志,并未发现有stuck(堵塞)线程。
2.查出数据库AWR报告,负载很小,并没有问题。
3.用前端诊断工具httpwatch,诊断几个功能,发现一个有趣的问题,类似于Action类的请求都会等上3s,系统正常的时候登录页面出来是0.1s之内。这些action的请求返回的数据包都比较大,怀疑是防火墙有限制。
4.ping -l 25000 10.140.18.101,发现客户现场确实有限制,2.5k数据就是临界点。
5.与用户沟通,用户并不认账,反问,网络限制是一样的,为什么其他系统没有问题。
6.于是对四个weblogic多单点访问,很奇怪,有一个节点没有问题,其他的节点都很慢。
7.决定将这个没有性能问题的节点的代码替换有性能问题的节点,在替换代码过程中,发现其他的节点代码都是几个月之前的,而此期间多次打过增量。
总结:找到了管理的问题,打增量有问题,技术的问题还没有找到。