(目录)
一、IO 介绍
IO
的全称其实是:Input/Output
的缩写
传统的 IO
大致可以分为 4种类型
:
- InputStream、OutputStream
基于字节操作的 IO
- Writer、Reader
基于字符操作的 IO
- File
基于磁盘操作的 IO
- Socket
基于网络操作的 IO
IO都是依赖操作系统内核进行
的,我们程序中的IO读写其实是由操作系统内核中的read&write两大系统调用
。
那内核是如何进行IO交互的呢?
- 网卡收到经过网线传来的网络数据,并将网络数据写到内存中。
- 当网卡把数据写入到内存后,网卡向cpu发出一个中断信号,操作系统便能得知有新数据到来,再通过网卡中断程序去处理数据。
- 将内存中的网络数据写入到对应socket的接收缓冲区中。
- 当接收缓冲区的数据写好之后,应用程序开始进行数据处理。
对应抽象到java的socket代码简单示例如下:
public class SocketServer {
public static void main(String[] args) throws Exception {
// 监听指定的端口
int port = 8080;
ServerSocket server = new ServerSocket(port);
// server将一直等待连接的到来
Socket socket = server.accept();
// 建立好连接后,从socket中获取输入流,并建立缓冲区进行读取
InputStream inputStream = socket.getInputStream();
byte[] bytes = new byte[1024];
int len;
while ((len = inputStream.read(bytes)) != -1) {
//获取数据进行处理
String message = new String(bytes, 0, len,"UTF-8");
}
// 省略……
}
}
看到这个过程和底层内核的网络IO很类似,
主要体现在accept()等待从网络中的请求到来然后bytes[]数组作为缓冲区等待数据填满后进行处理
。而
BIO、NIO、AIO之间的区别就在于这些操作是同步还是异步,阻塞还是非阻塞。
二、同步与异步
同步 和 异步 指的是:
一个执行流程中每个方法是否必须依赖前一个方法完成后才可以继续执行
。
假设我们的执行流程中:依次是方法一和方法二
同步
指的是调用一旦开始,调用者必须等到方法调用返回后,才能继续后续的行为
。即方法二一定要等到方法一执行完成后才可以执行。
异步
指的是调用立刻返回
,调用者不必等待方法内的代码执行结束
,就可以继续后续的行为。(具体方法内的代码交由另外的线程执行完成后,可能会进行回调)。即执行方法一的时候,直接交给其他线程执行,不由主线程执行,也就不会阻塞主线程,所以方法二不必等到方法一完成即可开始执行。
同步与异步是从多个线程之间的协调来实现效率差异
三、阻塞与非阻塞
阻塞与非阻塞
主要是从 CPU 的消耗上来说
:
阻塞
就 是 CPU 停下来等待一个慢的操作完成 CPU 才接着完成其它的事
。
非阻塞
就是在等这个慢的操作在执行时 CPU 去干其它别的事
,等这个慢的操作完成时,CPU 再接着完成后续的操作。
虽然表面上看 非阻塞的方式可以明显的提高 CPU 的利用率
,但是也带了另外一种后果就是系统的线程切换增加
。增加的 CPU 使用时间能不能补偿系统的切换成本需要好好评估。
阻塞与非阻塞关注的是线程是否在原地等待
四、BIO NIO AIO
1. BIO
BIO全称是Blocking IO,是JDK1.4之前的传统IO模型,本身是
同步阻塞模式
。线程发起IO请求后,一直阻塞IO,直到缓冲区数据就绪后,再进入下一步操作。针对网络通信都是一请求一应答的方式,虽然简化了上层的应用开发,但在性能和可靠性方面存在着巨大瓶颈,试想一下如果每个请求都需要新建一个线程来专门处理,那么在高并发的场景下,机器资源很快就会被耗尽。
2. NIO
NIO
也叫Non-Blocking IO 是同步非阻塞的IO模型
。
线程发起io请求后,立即返回(非阻塞io)。同步指的是必须等待IO缓冲区内的数据就绪,而非阻塞指的是,用户线程不原地等待IO缓冲区,可以先做一些其他操作,但是要定时轮询检查IO缓冲区数据是否就绪。
Java中的NIO 是new IO的意思
。其实是NIO加上IO多路复用技术
。普通的NIO是线程轮询查看一个IO缓冲区是否就绪,而Java中的new IO指的是线程轮询地去查看一堆IO缓冲区中哪些就绪,这是一种IO多路复用的思想
。IO多路复用模型中,将检查IO数据是否就绪的任务,交给系统级别的select或epoll模型,由系统进行监控,减轻用户线程负担。
NIO主要有buffer、channel、selector三种技术的整合
,通过零拷贝
的buffer取得数据,每一个客户端通过channel在selector(多路复用器)
上进行注册。服务端不断轮询channel
来获取客户端的信息。channel上有connect,accept(阻塞)、read(可读)、write(可写)四种状态标识。根据标识来进行后续操作。所以一个服务端可接收无限多的channel。
不需要新开一个线程。大大提升了性能
。
3. AIO
AIO
是真正意义上的异步非阻塞IO模型
。
上述
NIO实现中
,需要用户线程定时轮询
,去检查IO缓冲区数据是否就绪,占用应用程序线程资源,其实轮询相当于还是阻塞的,并非真正解放当前线程,因为它还是需要去查询哪些IO就绪。
而真正的
理想的异步非阻塞IO应该让内核系统完成,用户线程只需要告诉内核,当缓冲区就绪后,通知我或者执行我交给你的回调函数
。
AIO可以做到真正的异步的操作,但实现起来比较复杂,支持纯异步IO的操作系统非常少,目前也就windows是IOCP技术实现了,而在Linux上,底层还是是使用的epoll实现的。
总结:
举个例子:
- BIO(同步阻塞):你到饭馆点餐,然后在那等着,啥都干不了,餐没做好,你就必须等着!
- NIO(同步非阻塞):你在饭馆点完餐,就去玩儿了。不过玩一会儿,就回饭馆问一声:好了没?
- AIO(异步非阻塞):饭馆打电话说,我们知道您的位置,一会给你送过来,安心玩儿就可以了,类似于外卖。
哪种方式更有效率呢?是不是一目了然呢?
BIO
:同步并阻塞
,服务器实现模式为一个连接一个线程
,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销,当然可以通过线程池机制改善。NIO
:同步非阻塞
,服务器实现模式为一个请求一个线程
,即客户端发送的连接请求都会注册到多路复用器上,多路复用器轮询到连接有I/O请求时才启动一个线程进行处理。AIO
:异步非阻塞
,服务器实现模式为一个有效请求一个线程
,客户端的 IO 请求都是由 OS 先完成了再通知服务器应用去启动线程进行处理。
五、Socket 和 NIO 的多路复用
1. 传统的 Socket 实现
会实现一个简单的 Socket,服务器端只发给客户端信息,再由客户端打印出来的例子
代码如下:
int port = 4343; //端口号
// Socket 服务器端(简单的发送信息)
Thread sThread = new Thread(new Runnable() {
@Override
public void run() {
try {
ServerSocket serverSocket = new ServerSocket(port);
while (true) {
// 等待连接
Socket socket = serverSocket.accept();
Thread sHandlerThread = new Thread(new Runnable() {
@Override
public void run() {
try (PrintWriter printWriter = new PrintWriter(socket.getOutputStream())) {
printWriter.println("hello world!");
printWriter.flush();
} catch (IOException e) {
e.printStackTrace();
}
}
});
sHandlerThread.start();
}
} catch (IOException e) {
e.printStackTrace();
}
}
});
sThread.start();
// Socket 客户端(接收信息并打印)
try (Socket cSocket = new Socket(InetAddress.getLocalHost(), port)) {
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(cSocket.getInputStream()));
bufferedReader.lines().forEach(s -> System.out.println("客户端:" + s));
} catch (UnknownHostException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
- 调用 accept 方法,阻塞等待客户端连接;
- 利用 Socket 模拟了一个简单的客户端,只进行连接、读取和打印;
在 Java 中,线程的实现是比较重量级的,所以
线程的启动或者销毁是很消耗服务器的资源的
,即使使用线程池来实现,使用上述传统的 Socket 方式,当连接数极具上升也会带来性能瓶颈
。原因是线程的
上线文切换开销会在高并发的时候体现的很明显
,并且以上操作方式还是同步阻塞式的编程,性能问题在高并发的时候就会体现的尤为明显。
以上的流程,如下图:
2. NIO 多路复用
介于以上高并发的问题,NIO 的多路复用功能就显得意义非凡了
。
NIO
是利用了单线程轮询事件的机制
,通过高效地定位就绪的 Channel
,来决定做什么,仅仅 select 阶段是阻塞的
,可以有效避免大量客户端连接时,频繁线程切换带来的问题,应用的扩展能力有了非常大的提高。
// NIO 多路复用
ThreadPoolExecutor threadPool = new ThreadPoolExecutor(4, 4,
60L, TimeUnit.SECONDS, new LinkedBlockingQueue<Runnable>());
threadPool.execute(new Runnable() {
@Override
public void run() {
try (Selector selector = Selector.open();
ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();) {
serverSocketChannel.bind(new InetSocketAddress(InetAddress.getLocalHost(), port));
serverSocketChannel.configureBlocking(false);
serverSocketChannel.register(selector, SelectionKey.OP_ACCEPT);
while (true) {
selector.select(); // 阻塞等待就绪的Channel
Set<SelectionKey> selectionKeys = selector.selectedKeys();
Iterator<SelectionKey> iterator = selectionKeys.iterator();
while (iterator.hasNext()) {
SelectionKey key = iterator.next();
try (SocketChannel channel = ((ServerSocketChannel) key.channel()).accept()) {
channel.write(Charset.defaultCharset().encode("你好,世界"));
}
iterator.remove();
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
});
// Socket 客户端(接收信息并打印)
try (Socket cSocket = new Socket(InetAddress.getLocalHost(), port)) {
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(cSocket.getInputStream()));
bufferedReader.lines().forEach(s -> System.out.println("NIO 客户端:" + s));
} catch (IOException e) {
e.printStackTrace();
}
首先,通过 Selector.open() 创建一个 Selector,作为类似调度员的角色;
然后,创建一个 ServerSocketChannel,并且向 Selector 注册,通过指定 SelectionKey.OP_ACCEPT,告诉调度员,它关注的是新的连接请求;
为什么我们要明确配置非阻塞模式呢?
这是因为阻塞模式下,注册操作是不允许的,会抛出 IllegalBlockingModeException 异常;
- Selector 阻塞在 select 操作,当有 Channel 发生接入请求,就会被唤醒;
下面的图,可以有效的说明 NIO 复用的流程:
就这样 NIO 的多路复用就大大提升了服务器端响应高并发的能力。