以下仅为个人学习的记录,如有疏漏不妥之处,还请不吝赐教。
Java在运行时字符char采用UTF-16进行编码。
public class RuntimeEncoding {
public static void main(String[] args) {
char c = '中';// Unicode code point :U+4e2d UTF-16: 0x4e2d
System.out.printf("0x%x\n", (int) c); // 0x4e2d
}
}
何为编码?
作为名词时,编码指字节序列,如字符中的UTF-8编码为0xe4b8ad;
作为动词时,编码指用某种方式将字符转换成电脑可以储存的字节序列,如字符中使用UTF-8的编码方式编码成的字节序列是0xe4b8ad.
java的String提供了编码的方法getBytes();
import java.io.UnsupportedEncodingException; public class Encode {
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "中";
byte[] b = s.getBytes("UTF-8");
System.out.print("编码为 ");
for(byte b1 : b)
System.out.printf("%x ",b1); // 编码为 e4 b8 ad
}
}
何为解码?
解码是编码的逆过程,指用某种将字节序列转换成人类可读的字符,如将字节序列0xe4b8ad按照UTF-8的方式转换成字符中。
import java.io.UnsupportedEncodingException; public class Decode {
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "中";
byte[] b = s.getBytes("UTF-8"); System.out.println("解码为: " + new String(b, "UTF-8")); //解码为 中
}
}