Java-IO流之转换流的使用和编码与解码原理

时间:2023-09-13 09:32:08

一、理论:

1、字符流和字节流区别是什么?

字符流=字节流+编码集,在实际读取的时候其实字符流还是按照字节来读取,但是会更具编码集进行查找编码集字典解析相应的字节,使得一次读取出一个字符;

2、什么是转换流?

转换流就是原本是字节流,但是读取到的数据是字符,所以我们希望使用字符流来进行操作,那么就可以使用转换流进行转换;

转换流=字节流+编码集。

转换流的特点是可以指定编码集。

3、转换流的作用:

(1)、从控制台读取数据输入(键盘输入),将它们写入到文件(我们写的是字符吧);

(2)、当对文件进行解析的时候,如果涉及编码,就需要使用转换流进行解码--------乱码可不好玩。

二、实战:

1、从键盘输入的文本保存到文件:

        try (InputStreamReader inReader = new InputStreamReader(System.in)) {
StringBuilder sb = new StringBuilder(); int ch;
try (OutputStream out = new FileOutputStream("console.txt")) {
while ((ch = inReader.read()) != -1) {
if ((char) ch == '\r')
continue; if ((char) ch == '\n') {
System.out.println(sb.toString().toUpperCase());
out.write(sb.toString().getBytes());
sb.delete(0, sb.length());
continue;
} sb.append((char) ch);
if (sb.toString().equals("esc"))
break;
}
} }

  1)、我们经常使用的System.out.println就是输入流,自然,和它相对应的就是输入流,输入者是键盘,输出的对象是到控制台;

2、编码和解码:

        try (BufferedReader inReaderGBK = new BufferedReader(new InputStreamReader(new FileInputStream("gbk.txt"), "gbk"))) {

            try (BufferedWriter outWriterUTF8 = new BufferedWriter(new OutputStreamWriter(new FileOutputStream("人类简史.txt"), "utf-8"))) {

                int ch;
while ((ch = inReaderGBK.read()) != -1) {
outWriterUTF8.write(ch);
} }
}

在上面的代码中,"gbk.txt"  文件是使用GBK编码,而 "人类简史.txt" 文件是使用utf-8;我们使用转换流把gbk编码格式的文件转换成了utf-8编码格式的文件。原理如下:

1、读取 "gbk.txt" 的时候,先读取的是字节,然后根据我们指定的编码集去查找字典,因此可以读取出正确的字符;

2、而在写入 "人类简史.txt" 文件的时候,字符先是经过了转换流,转换流接收到了字符,看了一下自己被指定为utf-8格式的,所以就去查编码集,把接收到的字符转换成了utf-8编码的格式,然后写入了文件;

3、over。