Java NIO系列(二) - Buffer

时间:2022-09-01 03:59:54

前言

Java NIO中,缓冲区用来临时存储数据,可以理解为是I/O操作中数据暂存的中转站。缓冲区直接为通道(Channel)服务,数据是从通道读入缓冲区,从缓冲区写入到通道中的。

缓冲区本质上是一块可以写入数据,然后可以从中读取数据的内存。这块内存被包装成NIO Buffer对象,并提供了一组方法,用来方便的访问这块内存

正文

Buffer的类型

Java NIO提供以下几种Buffer类型:

Java NIO系列(二) - Buffer

  • ByteBuffer
  • MappedByteBuffer
  • ShortBuffer
  • LongBuffer
  • FloatBuffer
  • CharBuffer
  • IntBuffer
  • DoubleBuffer

这些Buffer类型代表了Java中7种基本数据类型。换句话说,就是可以通过bytecharshortintlongfloatdouble类型来操作缓冲区中的数据。

Buffer的基本用法

使用Buffer读写数据一般遵循以下四个步骤:

  1. 写入数据到Buffer中;
  2. 调用Bufferflip()方法;
  3. Buffer中读取数据;
  4. 调用clear()方法或者compact()方法。

当向Buffer写入数据时,Buffer会记录下写了多少数据。一旦要读取数据,需要通过flip()方法将Buffer写模式切换到读模式。在读模式下,可以读取之前写入到Buffer的所有数据。

一旦读完了所有的数据,就需要清空缓冲区,让它可以再次被写入。两种方式能清空缓冲区:调用clear()compact()方法。

  • clear()方法:清空整个缓冲区,包括已读未读的数据。

  • compact()方法:只会清空已读的数据,未读的数据都被移到缓冲区起始处,新写入的数据将放到缓冲区未读数据后面

下面给出一个ByteBuffer的简单使用示例,其他缓冲区API的使用类似:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
public static void testReadFromBuffer() {
try {
RandomAccessFile file = new RandomAccessFile("D://test.txt", "rw");
FileChannel fileChannel = file.getChannel();
//创建容量为10byte的buffer
ByteBuffer byteBuffer = ByteBuffer.allocate(10);
// 不断地写入缓冲区,写一次读一次
while (fileChannel.read(byteBuffer) != -1) {
// 设置buffer切换模式为读模式
byteBuffer.flip();
while (byteBuffer.hasRemaining()) {
// 每次读取1byte,也就是一个字节
System.out.print((char) byteBuffer.get());
}
// 清空整个缓存区,准备下次写入
byteBuffer.clear();
}
fileChannel.close();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}

Buffer的重要属性

为了理解Buffer的工作原理,需要熟悉它的4个核心属性:

属性 含义 具体描述
capacity 容量 缓冲区可以容纳的最大数据量,在缓冲区创建时被设定并且不能改变
limit 上界 缓冲区中当前已使用的数据量
position 位置 缓冲区下一个要被读或写的元素的索引
mark 标记 调用mark()来设置mark=position,再调用reset()可以让position恢复到标记的位置即position=mark

其中,positionlimit的含义取决于Buffer处在读模式还是写模式。不管Buffer处在什么模式,capacity的含义总是一样的。

Java NIO系列(二) - Buffer

capacity

作为一个内存块Buffer有一个固定的大小值,也叫capacity。你最多只能写入capacity个的bytecharintlong等类型数据。一旦Buffer满了,需要将其清空(通过读数据或者清除数据)才能继续往里写数据。

position

  • 写入数据时

当你写数据到Buffer中时,position表示下一个可写入的数据的位置。position初始位置0,当一个bytecharintlong等数据写到Buffer后,position会向前移动到下一个可插入数据的Buffer单元。position最大可为capacity – 1

  • 读取数据时

当从Buffer读取数据时,position表示下一个可读取的数据的位置。当将Buffer写模式切换到读模式position会被重置为0。当从Bufferposition读取数据时,position向前移动到下一个可读的位置。

limit

  • 写入数据时

写模式下,Bufferlimit表示你最多能往Buffer里写多少数据。写模式下,limit等于Buffercapacity,也就是内存块的最大容量。

  • 写入数据时

当切换Buffer到读模式时,limit会被设置成写模式下的position值,limit表示你最多能读到多少数据。limit被设置成已写数据的数量,这个值在写模式下就是position

Buffer的方法

Buffer的分配

要想获得一个Buffer对象首先要进行分配,每一个Buffer类都有一个allocate()方法。下面是一个分配10字节capacityByteBuffer的例子:

1
ByteBuffer buf = ByteBuffer.allocate(10);

这是分配一个可存储1024个字符的CharBuffer

1
CharBuffer buf = CharBuffer.allocate(1024);

向Buffer中写入数据

写数据到Buffer有两种方式:

  • Channel将数据写入Buffer
1
int bytesRead = channel.read(buffer);
  • 通过Bufferput()方法写到Buffer中。
1
buffer.put(1);

put()ByteBuffer中为抽象方法,在ByteBuffer有很多的重载,由其子类HeapByteBufferDirectByteBuffer实现。

写模式切换为读模式

flip()方法将Buffer写模式切换到读模式。调用flip()方法会将position设回0,并将limit设置成之前position的值。

1
buffer.flip();

查看flip()方法的源码确认:

1
2
3
4
5
6
public final Buffer flip() {
limit = position;
position = 0;
mark = -1;
return this;
}

从Buffer从读取数据

Buffer中读取数据也有两种方式:

  • Buffer读取数据到Channel中。
1
int bytesWritten = channel.write(buf);
  • 通过Bufferget()方法从Buffer中读取数据。
1
byte b = buffer.get();

get()方法和put()一样有很多的重载,允许以不同的方式从Buffer中读取数据。例如:从指定position读取,或者从Buffer中读取数据到字节数组。

clear()和compact()方法

一旦读完Buffer中的数据,需要让Buffer准备好再次被写入。前面也说了,可以通过clear()compact()方法来完成。

clear()方法

如果调用的是clear()方法,position将被设回0limit被设置成capacity的值。

1
buffer.clear();

查看clear()方法的源码确认:

1
2
3
4
5
6
public final Buffer clear() {
position = 0;
limit = capacity;
mark = -1;
return this;
}

换句话说,Buffer被清空了。Buffer中的数据并未清除,只是这些标记告诉我们可以从哪里开始往Buffer里写数据。

compact()方法

如果调用的是compact()方法,所有的未读数据都将被拷贝到Buffer的起始位置,position会设置为最后一个未读元素的后面。limit()方法和clear()方法一样,会被设置为capacity的大小。

查看compact()方法的实现,此方法在ByteBuffer中为抽象方法,查看其子类HeapByteBuffer的实现:

1
2
3
4
5
6
7
8
9
10
11
public ByteBuffer compact() {
// 将未读的数据往前移动
System.arraycopy(hb, ix(position()), hb, ix(0), remaining());
// 设置postion为最后一个未读数据后面的位置
position(remaining());
// 设置limit为最大的容量
limit(capacity());
// 清除标记位
discardMark();
return this;
}

现在Buffer准备好写数据了,但是不会覆盖未读的数据。

mark()与reset()方法

通过调用mark()方法,可以标记Buffer中的一个特定position。之后可以通过调用reset()方法恢复到这个position。例如:

mark()方法

1
buffer.mark();

查看mark()方法的源码,mark变量被设置为position的值:

1
2
3
4
public final Buffer mark() {
mark = position;
return this;
}

reset()方法

1
buffer.reset();

查看mark()方法的源码,position变量被设置为之前的mark的值:

1
2
3
4
5
6
7
public final Buffer reset() {
int m = mark;
if (m < 0)
throw new InvalidMarkException();
position = m;
return this;
}

equals()与compareTo()方法

可以使用equals()compareTo()方法比较两个Buffer

equals()方法

当同时满足下列条件时,表示两个Buffer相等:

  1. 有相同的类型(bytecharintlong类型等)。
  2. Buffer中剩余的bytechar等元素的个数相等。
  3. Buffer中所有剩余的bytechar等都相同。

equals()方法比较的实际是Buffer中的剩余元素是否相等。它只是比较Buffer的一部分,不是每一个在它里面的元素都比较。

compareTo()方法

compareTo()方法比较两个Buffer的剩余元素(bytechar等)。
当满足下列条件时,则认为一个Buffer小于另一个Buffer

  1. 第一个不相等的元素小于另一个Buffer中对应的元素。
  2. 所有元素都相等,但第一个Buffer比另一个先耗尽(第一个Buffer的元素个数比另一个少)。

总结

这里只是对Buffer进行了入门的介绍,具体深入学习还需要查看各种缓冲区以及相关的具体实现。


欢迎关注技术公众号: 零壹技术栈

Java NIO系列(二) - Buffer零壹技术栈

本帐号将持续分享后端技术干货,包括虚拟机基础,多线程编程,高性能框架,异步、缓存和消息中间件,分布式和微服务,架构学习和进阶等学习资料和文章。