Java 中文字符编码

时间:2021-09-27 07:15:51
public class Test {

public static void main(String[] args){

String[] charsetNames={
"UTF-8",
"UTF-16",
"UTF-16BE",
"UTF-16LE",
"UTF-32",
"UTF-32BE",
"UTF-32LE",
"UNICODE",
"GBK",
"GB2312",
"GB18030",
"ISO8859-1",
"BIG5",
"ASCII"
};


for(int i=0;i<charsetNames.length;i++){
printByteLength(charsetNames[i]);
}

}

/**
* String类的不带参数的getBytes()方法会以程序所运行平台的默认编码方式为准来进行转换,
* 在不同环境下可能会有不同的结果,因此建议使用指定编码方式的getBytes(String charsetName)方法。
*/

public static void printByteLength(String charsetName){
String en="a"; //一个英文字符
String zh="啊"; //一个中文字符
try {
System.out.println(charsetName+"编码英文字符所占字节数:"+en.getBytes(charsetName).length);
System.out.println(charsetName+"编码中文字符所占字节数:"+zh.getBytes(charsetName).length);
System.out.println();
} catch (UnsupportedEncodingException e) {
System.out.println("非法编码格式!");
}
}
}

结果

UTF-8编码英文字符所占字节数:1
UTF-8编码中文字符所占字节数:3

UTF-16编码英文字符所占字节数:4
UTF-16编码中文字符所占字节数:4

UTF-16BE编码英文字符所占字节数:2
UTF-16BE编码中文字符所占字节数:2

UTF-16LE编码英文字符所占字节数:2
UTF-16LE编码中文字符所占字节数:2

UTF-32编码英文字符所占字节数:4
UTF-32编码中文字符所占字节数:4

UTF-32BE编码英文字符所占字节数:4
UTF-32BE编码中文字符所占字节数:4

UTF-32LE编码英文字符所占字节数:4
UTF-32LE编码中文字符所占字节数:4

UNICODE编码英文字符所占字节数:4
UNICODE编码中文字符所占字节数:4

GBK编码英文字符所占字节数:1
GBK编码中文字符所占字节数:2

GB2312编码英文字符所占字节数:1
GB2312编码中文字符所占字节数:2

GB18030编码英文字符所占字节数:1
GB18030编码中文字符所占字节数:2

ISO8859-1编码英文字符所占字节数:1
ISO8859-1编码中文字符所占字节数:1

BIG5编码英文字符所占字节数:1
BIG5编码中文字符所占字节数:2

ASCII编码英文字符所占字节数:1
ASCII编码中文字符所占字节数:1

请点击此处链接查看原文出处