UTF-8 vs GB18030,共存还是对抗?

时间:2022-05-05 17:30:48
  在讨论这个问题之前,我想应该先给本文的标题(UTF-8 vs GB18030,共存还是对抗?)加一个限定条件:在中国,即在中国UTF-8 vs GB18030,共存还是对抗?为了更清楚的理解这个问题,我们先来看看两种编码方式。 1.UTF-8:即国际通用字符编码,顾名思义该编码方式囊括了世界各个国家及地区使用的字符集,尤其是对于英文字母的表示方法仅占用一个字节,很好的支持了欧美等国家的需要。 2.gb18030:是新出的国家标准(非国际标准)。这个标准由国家强制执行(也是为了保证中国信息业的地位,以及争取一定的主动权),所以所有在*销售的操作系统必须支持gb18030。现在的Gb18030不仅包含了简体和繁体汉字(考虑到*地区),支持中国少数名族文字,还包含了日韩等国的象形文字。 现在gb18030与UTF8的主要关系还是竞争,那到底谁将笑到最后?是UTF8一统天下还是gb18030笑傲江湖?我们先分析一下两种编码的优缺点: 1.UTF8的优点: (1)因为UTF8是为了统一世界上各种各样的编码而设计的, 故其最重要的优点的就是通用性强,在当前国际化的趋势下,UTF8已经占得了先机。这样世界各地只要使用UTF8编码都可以自如的交换文档。 (2)当今著名软件开发公司均位于英美等发达国家,考虑到全球英语等使用程度较高,所以采用UTF8开发的软件是比占据主导地位。各大知名网站、论坛为了扩大自己的影响力。自然也乐意使用UTF8编码方式,不至于其他国家的网迷浏览是出现乱码。 2. UTF8的缺点: 因为为了兼顾世界所有语言的字符,所以UTF8必须采用很多位来给字符编号(其常用部分还是很简洁,如英文字母编码),例如中文这样的字符就采用3字节编码方式,不如gb18030表示的简练。并且其收录的中文字符也不如gb18030多。尤其在*强制使用gb18030的标准的环境下,UTF8要想普及还有很长的路要走。 3. gb18030的优点: 首先gb18030的兼容性好,和以前发布的国标码都兼容,故软件不用做多大改动。并且是国家强制执行,由于中国庞大市场的原因,任何国际有名的软件开发公司都会争抢中国这块市场,所以基于gb18030的软件会越来越多。 4. gb18030的缺点: gb18030对于英文字母需要2个字节的编码,这样对于一些使用英文较多的网站,使用gb18030编码就太占用空间了。另外很大一部分国外软件可能并不支持gb18030,故使用这些软件的时候要打补丁。 从上述的分析可以看出gb18030和UTF8均牵扯到部分国家的利益问题,两种编码竞争的最终结果就要看哪个国家会做出让步,增加自己编码的复杂度,来满足另外一种编码的普及。不过这种事情应该不会发生,但是中国有足够的市场吸引力,英美又有足够的经济实力并且UTF8也有一定的受用群众,所以在以后相当长的时间里,两者将会共存,知道有一天另外两种更好的编码方式分别取代现在的两种,依次循环下去。