自动检测汉字GB18030编码与UTF-8编码

时间:2015-04-03 11:36:23
【文件属性】:

文件名称:自动检测汉字GB18030编码与UTF-8编码

文件大小:2KB

文件格式:GZ

更新时间:2015-04-03 11:36:23

汉字编码检测 GB18030 UTF-8

想到如下特征来识别汉字: 1. 如果第1位是0就不需要判断的,一定是ASCII字符。 2. 如果第1位是1开头的,第2位是0开头的,一定是GB编码。 3. 如果第1位是非1110开头的,则一定是GB编码。 4. 多做几个汉字判断。


【文件预览】:
char_code
----README.txt(1KB)
----gb18030.txt(13B)
----utf8.txt(19B)
----test.c(930B)
----char_code.h(1KB)
----Makefile(75B)

网友评论

  • 虽然我看到代码比较乱,不过readme还是比较有用哈
  • 有用可以参考一下
  • 谢谢分享!!
  • 可以参考一下 readme有用
  • 有用可以参考一下
  • 虽然我看到代码比较乱,不过readme还是比较有用哈
  • 虽然我看到代码比较乱,不过readme还是比较有用哈