一丶限流器存在的意义
在高并发系统中,出于系统保护角度考虑,通常会对流量进行限流。
限流*的目的是在遇到流量高峰期或者流量突增(流量尖刺)时,通过对流量速率进行限制,当达到限制速率时,可以拒绝服务(定向到错误页或告知资源没有了)、排队或等待(比如秒杀、评论、下单)、降级(返回兜底数据或默认数据,如商品详情页库存默认有货)
二丶限流器算法与实现
0. 写在前面
笔者碰到这样的一道题,有下面的接口,需要实现1s秒只可以申请max次资源,需要考虑到并发性能
。
显然这是一个限流器,网上有许多博主使用锁
来实现,笔者将使用juc中的原子类,使用自旋+cas
实现。并不是说自旋+cas 一定优于锁(自旋是cpu操作,在并发很高的时候会浪费cpu资源),但是相对于锁可以减少用户态到内核态的切换(这是由于java线程和操作系统线程是1比1的模型,上锁是需要切换到内核态的,尽管synchronized 具备锁升级,但是如果并发高了,最终还是重量级锁,依旧具备开销)笔者的cas都没有自定义cas次数,实际使用应该是自旋若干次就放弃,或者切换为使用锁的方式。并且这里都是单机的限流,分布式的限流需要使用其他中间件,如redis实现。
而且在并发很高,很极限的情况下,这种cas的方式存在bug,所以成熟的实现如gauva的限流器,是使用synchronized实现的。
1.计数器算法
1.2 概述
当前接口限定1s只可以提供n次服务,对于此需求,我们很直观的可以想到使用属性记录当前是第几秒,并且记录这一秒内请求了多少次。
在指定周期内累加访问次数,当访问次数达到设定的阈值时,触发限流策略,当进入下一个时间周期时会将访问次数清零
-
优点:简单直接
-
缺点:临界问题
如果在0.51s内请求max次,从1s1.5s请求max次,这样可以实现在0.5~1.5这一秒内请求来到2max次。
1.2 实现
首先我们要记录 在x秒
请求了y次
,并且这两个值必须是原子的。
这里我们使用AtomicStampedReference
(JUC源码学习笔记4——原子类,CAS,Volatile内存屏障,缓存伪共享与UnSafe相关方法中讲到过),此类本意是为了防止cas的ABA问题,其中会记录值和对应的版本
,并且其compareAndSet
方法可以同时更新值和对应的版本,这里我们使用版本表示当前是多少秒,请求多少次使用AtomicInteger
记录,方便我们在同一秒的时候更新请求数量。
public class CountRateLimiter implements RateLimiter {
/**
* 一秒可以接受多少个请求
*/
private final int numAcceptablePerSecond;
/***
* 版本号对应秒数
* 里面的 AtomicInteger 记录这一秒范围内的请求数量
*/
private final AtomicStampedReference<AtomicInteger> helper;
public CountRateLimiter(int numAcceptablePerSecond) {
this.numAcceptablePerSecond = numAcceptablePerSecond;
this.helper =
new AtomicStampedReference<>(new AtomicInteger(numAcceptablePerSecond), -1);
}
@Override
public boolean acquire(int n) {
//不要太过分了
if (n > numAcceptablePerSecond) {
return false;
}
//上一次请求是多少秒的请求
int oldSeconds = helper.getStamp();
//当前多少秒
int currentSeconds = currentSeconds();
//不是同一秒的请求
//如果和当前不是一个版本(意味着不是同一秒) 那么cas 修改版本并重置许可数量
if (oldSeconds != currentSeconds) {
//原剩余的许可数量
AtomicInteger oldPermits = helper.getReference();
//cas 修改 同时修改版本,并且扣减数量
if (helper.compareAndSet(oldPermits,
//新许可的数量为 numAcceptablePerSecond - n
new AtomicInteger(numAcceptablePerSecond - n), oldSeconds, currentSeconds)) {
//cas 成功 那么说明成功 拿到令牌
return true;
}
}
//到这里说明 是同一秒(oldSeconds == currentSeconds)
//或者上面的if存在多线程竞争当前线程竞争失败 其他线程重置了计数器 ==> 那么cas 减少许可数量
//这里判断了一下 当前秒还是相等的,避免由于gc在第一个if中停留太久,比如第一秒线程A和B进入到第一个if,线程B成功了,但是线程A失败了,并且暂停了2s,出来的时候时间已经是3s了,我们不能让1s的请求占用3s时候的令牌数
return currentSeconds() == currentSeconds &&
//最后这里存在问题 如果在0.99999s的请求来到这里,但是时间来到1s,这个cas才成功,那么0.99999s的请求将打过来。导致1s的qps大于max
helper.getReference().addAndGet(-n) >= 0;
}
private static int currentSeconds() {
return (int) ((System.currentTimeMillis() / 1000) % Integer.MAX_VALUE);
}
}
2.滑动窗口
2.1 概述
为了避免计数器中的临界问题,让限制更加平滑,将固定窗口中分割出多个小时间窗口,分别在每个小的时间窗口中记录访问次数,然后根据时间将窗口往前滑动并删除过期的小时间窗口。
计数器算法,可以看做只有两个窗口,因此在两个窗口边界的时候会出现临界问题。而滑动窗口统计当前时间处于的1s内产生了多少次请求,避免了临界问题
- 优点:实现相对简单,且没有计数器算法的临界问题
- 缺点:无法应对短时间高并发(突刺现象),比如我在间歇性高流量请求,每一批次的请求,处于不同的窗口(图中的虚线窗口)(如10.1s,20.1s分别产生max次请求,其实的系统qps还是大于max的)
2.2 实现
/**
* 滑动窗口限流器
* <p>
* 假设指定窗口总时长 为 1s 可以接受 10个请求,窗口分为5格
* 说明单格时间长度为200毫秒
* |_____|_____|_____|_____|_____|
* 0 200 400 600 800 1000
* <p>
* 当前时间为 500毫秒 那么落在 (500/200)%5 也就是第二格
* 那么500 毫秒是否可以接受请求 需要统计所有格子中的数量
* <p>
* 当时间来到 1500 毫秒,落在 (1500/200)%5 也是第二格
* |_____|_____|_____|_____|_____|_____|_____|_____|
* 0 200 400 600 800 1000 1200 1400 1600
* 从500到1500才是我们需要记录的,窗口数组大小是不变的
*
* 500的窗口版本是 500/1000 = 0
* 1500的窗口版本是 1500/1000 = 1
*
* 根据窗口版本来统计 哪些格子我们是要统计的,如果旧窗口版本小于当前窗口版本 不要计数
* (这里的版本 可以理解为没过 1000秒 版本加1,版本不同意味着是一秒前的数据)
*
* @author cuzz
* @version 1.0
**/
public class SlidingWindowRateLimiter implements RateLimiter {
//滑动窗口中的一个元素
private static class WindowElement {
/***
* 版本
*/
private volatile long version;
/**
* 计数
*/
private final AtomicInteger counter;
private WindowElement(long version, AtomicInteger counter) {
this.version = version;
this.counter = counter;
}
private void changeVersion(long newVersion) {
this.version = newVersion;
}
private void reset(int n) {
counter.set(n);
}
void add(int n) {
counter.addAndGet(n);
}
}
/**
* 整个窗口的大小,比如一秒 只能接受100个请求 那么此值设置为1000(毫秒)
*/
private final long windowTimeMillions = 1000;
/***
* 窗口的长度,窗口的长度,窗口越长,越能防止临界问题
*/
private final int windowLength;
/***
* 窗口数组
*/
private final AtomicReferenceArray<WindowElement> slidWindow;
/***
* 一秒接受 100个请求 那么此值设置为 100
*/
private final int canAcceptRequestTimes;
/**
* 记录 窗口每一个元素 对应的时间跨度
* 1秒接受100个请求 那么此处为 1000(毫秒)/100 = 10毫秒
*/
private final int millionsEachOne;
/**
* @param windowLength 指定窗口数量
* @param canAcceptRequestTimes 在 1s 内可以接受多少个请求
*/
public SlidingWindowRateLimiter(int windowLength,
int canAcceptRequestTimes) {
this.windowLength = windowLength;
this.canAcceptRequestTimes = canAcceptRequestTimes;
slidWindow = new AtomicReferenceArray<>(new WindowElement[windowLength]);
millionsEachOne = (int) (windowTimeMillions / windowLength);
}
@Override
public boolean acquire(int n) {
//1s分为5格 那么 一格200ms
//当前时间为 500毫秒 那么落在 (500/200)%5 也就是第二格
long currentTimeMillis = System.currentTimeMillis();
//这次请求 落在 哪个桶
int index = (int) ((currentTimeMillis / millionsEachOne) % windowLength);
//当前这次请求的 version 即当前是多少秒
long version = (currentTimeMillis - currentTimeMillis % windowTimeMillions);
//1. 拿到当前当前的计数
//1.1 如果计数为空 说明从来没有其他请求设置元素,这时,我们需要cas初始化结束计数
//1.2 如果计数不为空
// 1.2.1 是相同的版本 那么自增计数
// 1.2.3 如果不是相同的版本(之前版本小于当前版本),那么更新版本
// 1.2.4 如果不是相同的版本(之前版本大于当前版本),基本上不可能,因为时间是不会倒流的
//操作这次请求落下的桶
WindowElement currentIndex = slidWindow.accumulateAndGet(index,
new WindowElement(version, new AtomicInteger(n)), (old, now) -> {
//计数为空 说明从来没有其他请求设置元素,这时,我们需要cas初始化结束计数
if (old == null) {
return now;
}
//当前请求的次数
int currentRequest = now.counter.get();
//是同一秒 那么自增
if (old.version == now.version) {
old.add(now.counter.get());
} else {
//如果不是相同的版本(之前版本小于当前版本),那么更新版本 更新技术
old.reset(currentRequest);
old.changeVersion(now.version);
}
return old;
});
//大于最大数量返回false 这一瞬间对应的元素 就已经超出了我们的预期 那么返回false
if (currentIndex.counter.get() > canAcceptRequestTimes) {
return false;
}
//统计窗口内所有请求数
long sum = 0;
//下面这一段 不具备瞬时一致性
for (int i = 0; i < windowLength; i++) {
WindowElement e = slidWindow.get(i);
if (e != null && e.version == version) {
sum += e.counter.get();
if (sum > canAcceptRequestTimes) {
return false;
}
}
}
//小于等于才可以
return sum <= canAcceptRequestTimes;
}
}
感觉滑动窗口,不使用锁,是比较难实现的,因为上面的增加次数 和下面的 统计总数,不具备原子性。
3. 漏桶算法
漏桶限流算法的核心就是, 不管上面的水流速度有多块, 漏桶水滴的流出速度始终保持不变。
这里的水流就是我们的请求,漏水的速度始终不变,是指我们业务线程处理的速度不变,每隔一段时间从任务队列中拿一个请求进行处理
漏桶算法,我觉得可以用于网关层,每次请求来了放在阻塞队列,然后网关线程,每隔一段线程拿出一个请求去转发执行,但是转发请求,拿到返回进行响应的时间是不固定,所以网关线程需要使用其他的线程去异步处理,网关线程只负责定时拿请求分配给其他线程异步处理。(本题目中接口要求立马返回false 或者true,不太契合就没写了)
大体的思路就是请求来了塞到任务队列,定时线程每隔一段时间取一个请求,交给另外的线程异步处理。如果请求太多,那么阻塞队列塞不进去,直接返回false。
4.令牌桶算法
4.1 概述
令牌桶算法:请求执行作为消费者,每个请求都需要去桶中拿取一个令牌,取到令牌则继续执行;如果桶中无令牌可取,就触发拒绝策略,可以是超时等待,也可以是直接拒绝本次请求,由此达到限流目的。当桶中令牌数大于最大数量的时候,将不再添加。它可以适应流量突发,N 个请求到来只需要从桶中获取 N 个令牌就可以继续处理。
4.2 实现
Guava中的RateLimiter 使用此算法,且提供了预热模式,推荐使用
4.2.1 定时任务定时生成
我们可以使用一个定时任务每隔一段时间想桶中生成令牌,记录令牌的数量使用原子类。
这样实现非常简单,但是每一个限流器需要一个线程去生成,如果我们存在100个接口单独限流,那么需要100个线程
4.2.2 延迟计算令牌数量
我们需要记录上一次请求的时间,和桶中剩余的令牌数,并且桶中的数量最好为double类型,因为此次请求和上一次请求的间隔时间,生成的令牌数可以为小数。所以我实现一个Helper内部类,实现这两个值的原子更新
static class Helper {
//同时记录上一次请求时间 和 剩余数量
private static class Pair {
public Pair(long time, double count) {
this.time = time;
this.count = count;
}
final long time;
final double count;
}
private double count() {
return pair.count;
}
private long time() {
return pair.time;
}
//同时记录上一次请求时间 和 剩余数量
private volatile Pair pair;
//反射获取unsafe进行cas操作
private static final Unsafe UNSAFE = getUnsafe();
Helper(double count) {
pair = new Pair(-1, count);
}
//pair 字段的偏移,cas需要当期更改对象的地址
private final static long OFFSET_OF_PAIR;
static {
try {
OFFSET_OF_PAIR = UNSAFE.objectFieldOffset(Helper.class.getDeclaredField("pair"));
} catch (NoSuchFieldException e) {
throw new RuntimeException(e);
}
}
//cas修改,一次是,上一次的时间 和上一次剩余数量,和当前时间,当前数量
boolean cas(long oldTime, double oldCount, long newTime, double newCount) {
final Pair current = pair;
return oldTime == current.time &&
//小于0.00001视为 数量相同,这里需要根据并发度进行设定
Math.abs(oldCount - current.count) < 0.00001 &&
casPair(current, new Pair(newTime, newCount));
}
//cas修改 调用unsafe 实现
boolean casPair(Pair old, Pair newPair) {
return UNSAFE.compareAndSwapObject(this, OFFSET_OF_PAIR, old, newPair);
}
private static Unsafe getUnsafe() {
try {
Constructor<Unsafe> constructor = Unsafe.class.getDeclaredConstructor();
constructor.setAccessible(true);
return constructor.newInstance();
} catch (Exception e) {
throw new RuntimeException(e);
}
}
}
public class TokenRateLimiter3 implements RateLimiter {
//一秒可以接受多少请求
private final int tokenPerSeconds;
//记录token数量和上次请求时间
private final Helper tokenCount;
public TokenRateLimiter3(int tokenPerSeconds) {
this.tokenPerSeconds = tokenPerSeconds;
tokenCount = new Helper(0);
}
@Override
public boolean acquire(int n) {
if (n > tokenPerSeconds) {
return false;
}
//当前请求时间
long currentTimeMillis = System.currentTimeMillis();
while (true) {
//当前token 有多少个
double token = tokenCount.count();
//上一期请求时间
long preRequestTime = tokenCount.time();
//这段时间可以生成多少令牌
double canGenerate = (((double) (currentTimeMillis - preRequestTime) / 1000.0)
* tokenPerSeconds);
//桶中可以存储的令牌的数量,最大不过 tokenPerSeconds
double canStore = Math.min(token + canGenerate, tokenPerSeconds);
//小于请求的令牌数
if (canStore < (double) n) {
return false;
}
//剩余多少令牌
double release = canStore - n;
//cas修改
if (tokenCount.cas(preRequestTime,
token, currentTimeMillis, release)) {
return true;
}
}
}
}