为什么Java中一个char能存下一个汉字

时间:2024-07-10 08:02:55

在Java中,char的长度是2字节,即16位,2的16次方是65536。

1、如果采用utf-8编码,一个汉字占3个字节,char为什么还能存下一个汉字呢?

参考:https://developer.aliyun.com/ask/65417?spm=a2c6h.13159736、https://blog.****.net/shipfei_****/article/details/81900952、https://blog.****.net/Sugar_Z_/article/details/51276984

因为Java使用Unicode字符集,Unicode用两个字节表示世界上所有的文字集合。utf-8是字符编码。字符集和字符编码不一样。

一个java文件使用utf-8编码,经过编译之后,使用unicode字符集。

字符集,就是包含各种字符的集合。utf-8是用来给unicode进行编码的。

utf-8字符编码,就是把字符和字节对应起来的一种方式。

2、遇到生僻字,String是咋存的?

示例代码:

public static void charTest() {
String s = "

相关文章