文件名称:自动检测汉字GB18030编码与UTF-8编码
文件大小:2KB
文件格式:GZ
更新时间:2015-04-03 11:36:23
汉字编码检测 GB18030 UTF-8
想到如下特征来识别汉字: 1. 如果第1位是0就不需要判断的,一定是ASCII字符。 2. 如果第1位是1开头的,第2位是0开头的,一定是GB编码。 3. 如果第1位是非1110开头的,则一定是GB编码。 4. 多做几个汉字判断。
【文件预览】:
char_code
----README.txt(1KB)
----gb18030.txt(13B)
----utf8.txt(19B)
----test.c(930B)
----char_code.h(1KB)
----Makefile(75B)