Redis通常被称为单进程单线程模型。
这不是真的!
Redis还运行多个后端线程来执行后端清理工作,例如清理脏数据和关闭文件描述符。在Redis中,主线程负责主要任务,包括但不限于:接收来自客户端的连接,处理连接读/写事件,解析请求,处理命令,处理定时器事件和同步数据。只有一个CPU核心运行单个进程和单个线程。
对于小数据包,Redis服务器可以处理80,000到100,000 QPS。更大的QPS超出了Redis服务器的处理能力。常见的解决方案是在分布式架构中对数据进行分区并采用多个服务器。
然而,该解决方案也具有许多缺点。例如,要管理的Redis服务器太多; 某些适用于单个Redis服务器的命令不适用于数据分区; 数据分区无法解决热点读/写问题; 数据偏斜,重新分配和放大/缩小变得更加复杂。由于单进程和单线程的限制,我们希望可以重构多线程以充分利用SMP多核架构的优势,从而提高单个Redis服务器的吞吐量。
要使Redis成为多线程,最简单的思考方式是每个线程都执行I / O和命令处理。但是,由于Redis处理的数据结构很复杂,多线程需要使用锁来确保线程安全。锁定粒度的不正确处理可能会降低性能。
我们建议增加I / O线程的数量,以使独立的I / O线程能够读取/写入连接,解析命令和回复数据包中的数据,并且仍让单个线程处理命令并执行计时器事件。这样,可以增加单个Redis服务器的吞吐量。
单进程和单线程模型
好处
由于单进程和单线程模型的限制,耗时的操作(例如dict rehash和过期的密钥删除)被分解为多个步骤并在Redis实现中逐个执行。这防止了操作长时间执行,因此避免了操作对系统的长时间阻塞。单进程和单线程代码易于编译,这减少了由多进程和多线程引起的上下文切换和锁定占用。
缺点
只能使用一个CPU内核,无法利用多核优势。
对于繁重的I / O应用程序,网络I / O操作会消耗大量CPU容量。使用Redis作为缓存的应用程序通常是繁重的I / O应用程序。这些应用程序基本上具有高QPS,使用相对简单的命令(例如get,set和incr),但是对RT敏感。它们通常具有高带宽使用率,甚至可能达到数百兆比特。由于10 GB和25 GB网络适配器的普及,网络带宽不再是瓶颈。因此,我们需要考虑的是如何利用多核的优势和网络适配器的性能。
多线程模型与实现
线程模型
有三种线程类型,即:
主线程
I / O线程
工人线程
-
主线程:接收连接,创建客户端,并转发到I / O线程的连接。
I / O线程:处理连接读/写事件,解析命令,将完整解析的命令转发到工作线程进行处理,发送响应数据包并删除连接。
工作线程:处理命令,生成客户端响应数据包,并执行计时器事件。
主线程,I / O线程和工作线程分别由事件驱动。
线程通过无锁队列交换数据,并通过隧道发送通知。
多线程模型的好处
提高读/写性能
压力测试结果表明,在小数据包场景中,读/写性能可提高约三倍。
-
提高主/从同步速度
当主设备将同步数据发送到从设备时,数据将在I / O线程中发送。从主站读取数据时,从站从工作线程读取完整数据,从I / O线程读取增量数据。这可以有效地提高同步速度。
后续任务
第一项任务是增加I / O线程数并优化I / O读/写功能。接下来,我们可以分解工作线程,以便每个线程完成I / O读取,以及工作线程的工作。
设置I / O线程数
测试结果表明I / O线程的数量不应超过6.否则,工作线程将成为简单操作的瓶颈。
在启动进程时,必须设置I / O线程的数量。进程运行时,无法修改I / O线程数。根据当前的连接分配策略,修改I / O线程的数量涉及重新分配连接,这非常复杂。
注意事项
随着10 GB和25 GB网络适配器的普及,必须仔细考虑如何充分利用硬件性能。我们可以使用技术,例如用于networkI / O的多线程和内核绕过用户模式协议栈。
I / O线程可用于实现无阻塞数据迁移。I / O线程对数据进程进行编码或转发命令,而目标节点对数据进行解码或执行命令。
————————————————————
推荐阅读: