转载请注明出处:jiq•钦's technical Blog - 季义钦
引言
BIO和NIO是两种不同的网络通信模型,现现在NIO已经大量应用在Jetty、ZooKeeper、Netty等开源框架中。
一个面向流、一个面向缓冲区
一个是堵塞式的、一个非堵塞
一个没有io多路复用器、一个有
以下通过一个样例解释两者差别:
假设当前服务端程序须要同一时候从与多个client建立的连接读取数据。
使用BIO
假设採用堵塞式IO。单线程情况下。处理者线程可能堵塞在当中一个套接字的read上,导致还有一个套接字即使准备好了数据也无法处理。这个时候解决办法就是针对每个套接字。都新建一个线程处理其数据读取。
所以说,在BIO工作模式下,服务端程序要想同一时候处理多个套接字的数据读取,在等待接收连接请求的主线程之外,还要为每个建立好的连接分配一个新的线程进行处理。
使用NIO
轮询方式
假设将套接字读操作换成非堵塞的,那么仅仅须要一个线程就能够同一时候处理套接字,每次检查一个套接字。有数据则读取,没有则检查下一个。由于是非堵塞的。所以运行read操作时若没有数据准备好则马上返回。不会发生堵塞。
I/O多路复用
这样的轮询的方式缺点是浪费CPU资源。大部分时间可能都是无数据可读的,不必仍不间断的重复运行read操作,I/O多路复用(IOmultiplexing)是一种更好的方法。调用select函数时。其内部会维护一张监听的套接字的列表,其会一直堵塞直到当中某一个套接字有数据准备好才返回。并告诉是哪个套接字可读,这时再调用该套接字的read函数效率更高。
所以基本能够觉得 “NIO = I/O多路复用 + 非堵塞式I/O”,大部分情况下是单线程。但也有超过一个线程实现NIO的情况
NIO三种模型
上面所讲到的仅仅须要一个线程就能够同一时候处理多个套接字,这仅仅是当中的一种单线程模型,是一种较为极端的情况。NIO主要包括三种线程模型:
1) Reactor单线程模型
2) Reactor多线程模型
3)主从Reactor多线程模型
Reactor单线程模型:
单个线程完毕全部事情包括接收client的TCP连接请求,读取和写入套接字数据等。
对于一些小容量应用场景。能够使用单线程模型。可是对于高负载、大并发的应用却不合适。主要原因例如以下:
1) 一个NIO线程同一时候处理成百上千的链路,性能上无法支撑,即便NIO线程的CPU负荷达到100%,也无法满足海量消息的编码、解码、读取和发送;
2) 当NIO线程负载过重之后。处理速度将变慢,这会导致大量client连接超时,超时之后往往会进行重发。这更加重了NIO线程的负载,终于会导致大量消息积压和处理超时,NIO线程会成为系统的性能瓶颈;
3) 可靠性问题:一旦NIO线程意外跑飞,或者进入死循环,会导致整个系统通信模块不可用。不能接收和处理外部消息,造成节点故障。
为了解决这些问题。演进出了Reactor多线程模型。
Reactor多线程模型:
Rector多线程模型与单线程模型最大的差别就是有一组NIO线程处理真实的IO操作。
Reactor多线程模型的特点:
1) 有专门一个NIO线程-Acceptor线程用于监听服务端,接收client的TCP连接请求;
2) 网络IO操作-读、写等由一个NIO线程池负责,线程池能够採用标准的JDK线程池实现。它包括一个任务队列和N个可用的线程,由这些NIO线程负责消息的读取、解码、编码和发送;
3) 1个NIO线程能够同一时候处理N条链路。可是1个链路仅仅相应1个NIO线程,防止发生并发操作问题。
在绝大多数场景下,Reactor多线程模型都能够满足性能需求;可是,在极特殊应用场景中。一个NIO线程负责监听和处理全部的client连接可能会存在性能问题。
比如百万client并发连接,或者服务端须要对client的握手消息进行安全认证,认证本身很损耗性能。在这类场景下,单独一个Acceptor线程可能会存在性能不足问题,为了解决性能问题。产生了第三种Reactor线程模型-主从Reactor多线程模型。
即从单线程中由一个线程即监听连接事件、读写事件、由完毕数据读写,拆分为由一个线程专门监听各种事件。再由专门的线程池负责处理真正的IO数据读写。
主从Reactor多线程模型
主从Reactor线程模型与Reactor多线程模型的最大差别就是有一组NIO线程处理连接、读写事件。
主从Reactor线程模型的特点是:服务端用于接收client连接的不再是个1个单独的NIO线程。而是一个独立的NIO线程池。Acceptor接收到clientTCP连接请求处理完毕后(可能包括接入认证等),将新创建的SocketChannel注冊到IO线程池(sub reactor线程池)的某个IO线程上,由它负责SocketChannel的读写和编解码工作。
Acceptor线程池仅仅仅仅用于client的登陆、握手和安全认证,一旦链路建立成功,就将链路注冊到后端subReactor线程池的IO线程上,由IO线程负责兴许的IO操作。
即从多线程模型中由一个线程来监听连接事件和数据读写事件,拆分为一个线程监听连接事件,线程池的多个线程监听已经建立连接的套接字的数据读写事件,另外和多线程模型一样有专门的线程池处理真正的IO操作。
各自适用场景
NIO适用场景
server须要支持超大量的长时间连接。比方10000个连接以上,而且每个client并不会频繁地发送太多数据。比如总公司的一个中心server须要收集全国便利店各个收银机的交易信息。仅仅须要少量线程按需处理维护的大量长期连接。
Jetty、Mina、Netty、ZooKeeper等都是基于NIO方式实现。
BIO适用场景
适用于连接数目比較小。而且一次发送大量数据的场景,这样的方式对server资源要求比較高,并发局限于应用中。