常见汉字的Unicode和GB2312映射表

时间:2019-07-23 15:47:55
【文件属性】:

文件名称:常见汉字的Unicode和GB2312映射表

文件大小:56KB

文件格式:ZIP

更新时间:2019-07-23 15:47:55

汉字 utf8 Unicode

在开发stm32时,从网上接收到utf8的数据流中包含汉字,如果要正确的在串口中打印汉字的话,就要把utf8(一个汉字3字节)转为GB2312(一个汉字2字节),这个过程不能直接转化,因为GB2312只有和16位的Unicode有映射,所以要先把utf8转为Unicode(这个网上有很多教程,不包含在本资料内),然后2分法查表就能找到GB2312对应映射了。


【文件预览】:
uni_2_gb_map.h
gb_2_uni_map.h

网友评论

  • 这个根本就不是gb2312,而是gbk,其实一般的应用只需要6763个字就行了
  • 很牛叉的表格!!!!! const unsigned short UNI_TO_GB[][2]= { //UNICODE , GB2312 {0x4e00,0xd2bb}, {0x4e01,0xb6a1}, {0x4e03,0xc6df}, {0x4e07,0xcdf2}, {0x4e08,0xd5c9}, {0x4e09,0xc8fd}, {0x4e0a,0xc9cf}, {0x4e0b,0xcfc2}, {0x4e0c,0xd8a2}, {0x4e0d,0xb2bb}, {0x4e0e,0xd3eb},
  • 谢谢 非常有用。。。