最近做项目经常会遇到Java中的乱码问题,于是就抽时间整理下出现乱码问题的情况和如何处理,这里做了一个整理,
分析
编码与解码
编码就是将字符转为字节,解码就是就是将字节转换为字符。
字节流与字符流
对文件的读写操作都是通过字节流来实现的,即使JAVA中有字符流,但是其底层仍然使用的字节流。
乱码问题出现
java中使用最频繁的是字符,当我们将文件读入内存并在控制台显示时(字节流--->字符流),就需要用到解码。如果文件是UTF-8编码,而我们解码时错用成GBK(如果不指定编码,JAVA会采取系统默认编码)来解码,那么只能显示乱码。而我们写文件时,最好指定编码(UTF-8)。
解决方案
示例1
将字节流转换为字符流时,我们指定编码格式。这是我们文件也应该是gb2312编码
1
2
3
4
5
6
7
8
9
10
11
12
|
public static String read(String filename) throws Exception {
InputStream is = new FileInputStream(filename);
BufferedReader in = new BufferedReader( new InputStreamReader(is,
"gb2312" )); //指定编码格式
String s;
StringBuilder sb = new StringBuilder();
while ((s = in.readLine()) != null ) {
sb.append(s + "\n" );
}
in.close();
return sb.toString();
}
|
示例2
直接通过字节流读入,使用String转换为字符时,指定编码。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
package com.dy.xidian;
import java.io.FileInputStream;
import java.io.InputStream;
class BufferedInputFile {
public static String read(String filename) throws Exception {
@SuppressWarnings ( "resource" )
InputStream is = new FileInputStream(filename);
byte [] b = new byte [ 1024 ];
is.read(b);
return new String(b, "gb2312" );
}
}
public class MemoryInput {
public static void main(String[] args) throws Exception {
String filename = "E:/html/gb2312.php" ;
String s = BufferedInputFile.read(filename);
System.out.println(s);
}
}
|
陷阱
I/O操作中有个FileReader类,这个类隐藏了字节流转为字符流的细节,我们可以这样使用。 BufferedReader in = new BufferedReader(new FileReader(filename)); 这样,我们直接得到就是字符流了。但我们发现,我们并没有去设置编码,这是因为FileReader中采用了默认编码方式。这就变得很危险了,如果其默认的编码格式和我们文件的编码不同,那么读出来的数据一定是乱码。所以我们最好采用示例中的方式来进行流的转换。
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!