java 中的乱码问题汇总及解决方案

时间:2022-04-23 10:11:05

java中的乱码问题

       最近做项目经常会遇到Java中的乱码问题,于是就抽时间整理下出现乱码问题的情况和如何处理,这里做了一个整理,

分析

编码与解码

    编码就是将字符转为字节,解码就是就是将字节转换为字符。

字节流与字符流

    对文件的读写操作都是通过字节流来实现的,即使JAVA中有字符流,但是其底层仍然使用的字节流。

乱码问题出现

    java中使用最频繁的是字符,当我们将文件读入内存并在控制台显示时(字节流--->字符流),就需要用到解码。如果文件是UTF-8编码,而我们解码时错用成GBK(如果不指定编码,JAVA会采取系统默认编码)来解码,那么只能显示乱码。而我们写文件时,最好指定编码(UTF-8)。

解决方案

示例1 

   将字节流转换为字符流时,我们指定编码格式。这是我们文件也应该是gb2312编码

?
1
2
3
4
5
6
7
8
9
10
11
12
public static String read(String filename) throws Exception {
    InputStream is = new FileInputStream(filename);
    BufferedReader in = new BufferedReader(new InputStreamReader(is,
        "gb2312"));           //指定编码格式
    String s;
    StringBuilder sb = new StringBuilder();
    while ((s = in.readLine()) != null) {
      sb.append(s + "\n");
    }
    in.close();
    return sb.toString();
}

示例2

  直接通过字节流读入,使用String转换为字符时,指定编码。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
package com.dy.xidian;
 
import java.io.FileInputStream;
import java.io.InputStream;
 
class BufferedInputFile {
  public static String read(String filename) throws Exception {
    @SuppressWarnings("resource")
    InputStream is = new FileInputStream(filename);
 
    byte[] b = new byte[1024];
    is.read(b);
    return new String(b, "gb2312");
  }
}
 
public class MemoryInput {
  public static void main(String[] args) throws Exception {
    String filename = "E:/html/gb2312.php";
    String s = BufferedInputFile.read(filename);
    System.out.println(s);
  }
}

 陷阱

   I/O操作中有个FileReader类,这个类隐藏了字节流转为字符流的细节,我们可以这样使用。 BufferedReader in = new BufferedReader(new FileReader(filename)); 这样,我们直接得到就是字符流了。但我们发现,我们并没有去设置编码,这是因为FileReader中采用了默认编码方式。这就变得很危险了,如果其默认的编码格式和我们文件的编码不同,那么读出来的数据一定是乱码。所以我们最好采用示例中的方式来进行流的转换。

 感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!