Java 运行时字符编码与解码

时间:2024-04-15 21:35:46

以下仅为个人学习的记录,如有疏漏不妥之处,还请不吝赐教

Java在运行时字符char采用UTF-16进行编码。

public class RuntimeEncoding {
public static void main(String[] args) {
char c = '中';// Unicode code point :U+4e2d UTF-16: 0x4e2d
System.out.printf("0x%x\n", (int) c); // 0x4e2d
}
}

何为编码?

  作为名词时,编码指字节序列,如字符中的UTF-8编码为0xe4b8ad;

  作为动词时,编码指用某种方式将字符转换成电脑可以储存的字节序列,如字符使用UTF-8的编码方式编码成的字节序列是0xe4b8ad.

  java的String提供了编码的方法getBytes();

import java.io.UnsupportedEncodingException;

public class Encode {
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "中";
byte[] b = s.getBytes("UTF-8");
        System.out.print("编码为 ");
for(byte b1 : b)
System.out.printf("%x ",b1); // 编码为 e4 b8 ad
}
}

何为解码?

  解码是编码的逆过程,指用某种将字节序列转换成人类可读的字符,如将字节序列0xe4b8ad按照UTF-8的方式转换成字符中。

import java.io.UnsupportedEncodingException;

public class Decode {
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "中";
byte[] b = s.getBytes("UTF-8"); System.out.println("解码为: " + new String(b, "UTF-8")); //解码为 中
}
}