首先我使用的开发环境是Eclipse.创建一个Java Project默认的编码则为GBK,如图:
下面便是具体代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
|
import java.io.UnsupportedEncodingException;
public class Demo1 {
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "我爱ABC" ;
byte [] bytes1 = s.getBytes( "gbk" ); //不写编码,则使用平台的默认字符集将此 String 编码为 byte序列,并返回byte[].
//s.getBytes(Charset charset) 使用给定的charset将此String编码到byte序列;
//返回的是一个byte[]字节数组
for ( byte b: bytes1){
System.out.print(Integer.toHexString(b& 0xff )+ " " );
//Integer.toHexString(int i)以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式
}
//gbk编码中文占有两个字节,英文占有一个字节
System.out.println();
byte [] bytes2 = s.getBytes( "utf-8" );
for ( byte b: bytes2){
System.out.print(Integer.toHexString(b& 0xff )+ " " );
}
//utf-8编码 中文占有三个字节,英文占有一个字节
System.out.println();
//java是双字节编码 --->utf-16be >> 中文和英文都占有两个字节
byte [] bytes3 = s.getBytes( "utf-16be" );
for ( byte b: bytes3){
System.out.print(Integer.toHexString(b& 0xff )+ " " );
}
/*当你的字节序列是某种编码时,这个时候想把字节序列变成
*字符串,也需要用这种编码方式,否则会出现乱码
* */
System.out.println();
String str1 = new String(bytes3);//用项目默认的编码即(GBK编码) ----->> bytes3在上面定义成“utf-16be”的编码了,所以会出现乱码
System.out.println(str1);
System.out.println();
String str2 = new String(bytes3,"utf-16be");
System.out.println(str2);
/*
* 文本文件就是字节序列
* 可以是任意编码的字节序列
* 如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码
*
*/
}
}
|
打印的结果:
总的来说,编码必须对应,不然会出现乱码。