Java 运行时字符编码与解码

时间:2022-06-26 15:45:46

以下仅为个人学习的记录,如有疏漏不妥之处,还请不吝赐教

Java在运行时字符char采用UTF-16进行编码。

public class RuntimeEncoding {
    public static void main(String[] args) {
        char c = '中';// Unicode code point :U+4e2d  UTF-16: 0x4e2d
        System.out.printf("0x%x\n", (int) c); // 0x4e2d
    }
}

 何为编码?

  作为名词时,编码指字节序列,如字符中的UTF-8编码为0xe4b8ad;

  作为动词时,编码指用某种方式将字符转换成电脑可以储存的字节序列,如字符使用UTF-8的编码方式编码成的字节序列是0xe4b8ad.

  java的String提供了编码的方法getBytes();

import java.io.UnsupportedEncodingException;

public class Encode {
        public static void main(String[] args) throws UnsupportedEncodingException {
            String s = "";
            byte[] b = s.getBytes("UTF-8");
        System.out.print("编码为 ");
for(byte b1 : b) System.out.printf("%x ",b1); // 编码为 e4 b8 ad } }

 

何为解码?

  解码是编码的逆过程,指用某种将字节序列转换成人类可读的字符,如将字节序列0xe4b8ad按照UTF-8的方式转换成字符中。

import java.io.UnsupportedEncodingException;

public class Decode {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String s = "";
        byte[] b = s.getBytes("UTF-8");
        
        System.out.println("解码为: " + new String(b, "UTF-8")); //解码为
    }
}