背景:
有一次在生产环境,突然出现了很多笔还款单被挂起,后来排查原因,发现是内部系统调用时出现了hystrix调用异常。在开发过程中,因为核心线程数设置的比较大,没有出现这种异常。放到了测试环境,偶尔有出现这种情况,后来在网上查找解决方案,网上的方案是调整maxqueuesize属性就好了,当时调整了一下,确实有所改善。可没想到在生产环境跑了一段时间后却又出现这种了情况,此时我第一想法就是去查看maxqueuesize属性,可是maxqueuesize属性是设置值了。当时就比较纳闷了,为什么maxqueuesize属性不起作用,后来通过查看官方文档发现hystrix还有一个queuesizerejectionthreshold属性,这个属性是控制队列最大阈值的,而hystrix默认只配置了5个,因此就算我们把maxqueuesize的值设置再大,也是不起作用的。两个属性必须同时配置
先看一下正确的hystrix配置姿势。
application.yml:
1
2
3
4
5
6
|
hystrix:
threadpool:
default :
coresize: 200 #并发执行的最大线程数,默认 10
maxqueuesize: 1000 #blockingqueue的最大队列数,默认值- 1
queuesizerejectionthreshold: 800 #即使maxqueuesize没有达到,达到queuesizerejectionthreshold该值后,请求也会被拒绝,默认值 5
|
接下来编写一个测试类,来验证几种错误配置,看看会出现什么情况。
测试类代码(a调用方):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
|
/**
* @author: xiongfeng
* @description:
* @date: created in 11:12 2018/6/11
*/
public class repaymenthelpertest extends fundapplicationtests {
@autowired
repaymenthelper repaymenthelper;
@autowired
private routerfeign routerfeign;
@test
public void hystrixtest() throws interruptedexception {
for ( int i = 0 ; i < 135 ; i++) {
new thread( new runnable() {
@override
public void run() {
job();
}
}).start();
}
thread.currentthread().join();
}
public void job() {
string repaymentno = "xf1002" ;
string transno = "t4324324234" ;
string reqno = "xf1002" ;
string begintime = "20180831130030" ;
string endtime = "20180831130050" ;
transrecqueryreqdto transrecqueryreqdto = new transrecqueryreqdto();
transrecqueryreqdto.settransno(transno);
transrecqueryreqdto.setbegintime(begintime);
transrecqueryreqdto.setendtime(endtime);
transrecqueryreqdto.setreqno(reqno);
resp<list<transrecdto>> querytransreclistresp = routerfeign.querytransrec( new req<>(repaymentno, "2018080200000002" , null , null , transrecqueryreqdto));
system.out.println(string.format( "获取结果为:【%s】" , jsonutil.tojson(querytransreclistresp)));
}
}
|
这个测试类的作用就是创建135个线程,通过routerfeign类并发请求b服务方,看看请求结果是否出现异常。
feign调用代码:
1
2
3
4
5
6
7
8
9
10
11
12
|
@feignclient (value = "${core.name}" , fallbackfactory = routerfeignbackfactory. class , path = "/router" )
public interface routerfeign {
/**
* 代扣结果查询
* @param transrecqueryreqdtoreq
* @return
*/
@postmapping ( "/querytransrec" )
resp<list<transrecdto>> querytransrec( @requestbody req<transrecqueryreqdto> transrecqueryreqdtoreq);
}
|
这个类,就是通过feign方式去调用b服务方的客户端
服务提供方代码(b服务方):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
/**
* @author: xiongfeng
* @description:
* @date: created in 16:04 2018/5/24
*/
@api ( "还款服务" )
@refreshscope
@restcontroller
@requestmapping ( "/router" )
public class testcontroller {
private static logger logger = loggerfactory.getlogger(testcontroller. class );
// 计数器
private static atomicinteger count = new atomicinteger( 1 );
@apioperation (value = "代扣结果查询" )
@postmapping ( "/querytransrec" )
resp<list<transrecdto>> querytransrec( @requestbody req<transrecqueryreqdto> transrecqueryreqdtoreq) throws interruptedexception {
system.out.println(string.format( "查询支付结果......计数: %s" , count.getandadd( 1 )));
thread.sleep( 500 );
return resp.success(respstatus.success.getdesc(), null );
}
|
这个类的作用,就是一个服务提供方,计数并返回结果。
下面我们看一下几种错误的配置。
案例一(将核心线程数调低,最大队列数调大一点,但是队列拒绝阈值设置小一点):
1
2
3
4
5
6
|
hystrix:
threadpool:
default :
coresize: 10
maxqueuesize: 1000
queuesizerejectionthreshold: 20
|
此时的结果:
左窗口是b服务方,右窗口是a调用方。从结果可以看出,调用135次,成功32次左右,其余线程全部抛异常。
案例二(将核心线程数调低,最大队列数调小一点,但是队列拒绝阈值设置大一点):
1
2
3
4
5
6
|
hystrix:
threadpool:
default :
coresize: 10
maxqueuesize: 15
queuesizerejectionthreshold: 2000
|
此时的结果:
java.util.concurrent.rejectedexecutionexception: task java.util.concurrent.futuretask@7d6d472b rejected from java.util.concurrent.threadpoolexecutor@17f8bcb7[running, pool size = 3, active threads = 3, queued tasks = 15, completed tasks = 0]
左窗口是b服务方,右窗口是a调用方。从结果可以看出,调用135次,成功25次左右,其余线程全部抛异常。。
案例三(将核心线程数调低,最大队列数调大一点,但是队列拒绝阈值不设置值):
1
2
3
4
5
|
hystrix:
threadpool:
default :
coresize: 10
maxqueuesize: 1500
|
此时的结果:
java.util.concurrent.rejectedexecutionexception: rejected command because thread-pool queuesize is at rejection threshold.
左窗口是b服务方,右窗口是a调用方。此时的结果和案例一的情况一样,调用135次,成功47次左右,其余线程全部抛异常。报错跟案例一一样
案例四(将核心线程数调低,最大队列数不设值,但是队列拒绝阈值设置的比较大):
1
2
3
4
5
|
hystrix:
threadpool:
default :
coresize: 10
queuesizerejectionthreshold: 1000
|
此时的结果:
java.util.concurrent.rejectedexecutionexception: task java.util.concurrent.futuretask@23d268ea rejected from java.util.concurrent.threadpoolexecutor@66d0e2f4[running, pool size = 0, active threads = 0, queued tasks = 0, completed tasks = 0]
at java.util.concurrent.threadpoolexecutor$abortpolicy.rejectedexecution(threadpoolexecutor.java:2063)
at java.util.concurrent.threadpoolexecutor.reject(threadpoolexecutor.java:830)
at java.util.concurrent.threadpoolexecutor.execute(threadpoolexecutor.java:1379)
at java.util.concurrent.abstractexecutorservice.submit(abstractexecutorservice.java:112)
左窗口是b服务方,右窗口是a调用方。此时的结果和案例二的情况一样,调用135次,成功10次左右,其余线程全部抛异常。报错跟案例二一样
下面来看一看正确的配置案例
案例一:将核心线程数调低,最大队列数和队列拒绝阈值的值都设置大一点):
1
2
3
4
5
6
|
hystrix:
threadpool:
default :
coresize: 10
maxqueuesize: 1500
queuesizerejectionthreshold: 1000
|
此时的结果:
左窗口是b服务方,右窗口是a调用方。此时的结果就完全正常了,并发请求了135次,全部成功!
结论:官方默认队列阈值只有5个, 如果要调整队列,必须同时修改maxqueuesize和queuesizerejectionthreshold属性的值,否则都会出现异常!参考文档:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://segmentfault.com/a/1190000018049081