字符集和字符编码

时间:2022-09-22 20:48:36

字符集(Charset):一组抽象字符的集合
字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。 字符集常常和一种具体的语言文字对应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符集。 

字符编码(Encoding):计算机要处理各种字符,字符编码将字符和二进制内码对应起来 
制定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制数字对应起来。根据字符集内字符的多少,会确定用几个字节来编码。 每种编码都限定了一个明确的字符集合。

字符集有:ASCII、unicode等
对于unicode字符集,有utf8,utf16,utf32等多种编码方式

具体可见https://www.google.com.hk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&ved=0CC4QFjAD&url=%68%74%74%70%3a%2f%2f%77%65%62%63%65%6e%74%65%72%2e%68%69%74%2e%65%64%75%2e%63%6e%2f%61%72%74%69%63%6c%65%73%2f%32%30%30%39%2f%30%34%2d%30%31%2f%30%34%31%39%33%33%35%36%2e%68%74%6d&ei=eBd4VOiiMMjz8gW20IH4Cg&usg=AFQjCNHf8E7lBzHvY-cUxAy5nb8knlwlqQ&cad=rjt

zh_cn:不是字符编码而是语言代码

具体可见:https://www.google.com.hk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=0CCMQFjAB&url=%68%74%74%70%3a%2f%2f%7a%68%69%64%61%6f%2e%62%61%69%64%75%2e%63%6f%6d%2f%71%75%65%73%74%69%6f%6e%2f%31%31%39%35%36%39%38%39%32%2e%68%74%6d%6c&ei=Zht4VNLKLKO7mQWW2oCwAg&usg=AFQjCNFLd0VyyBdbVq41SnUobfG6MS-q4Q&cad=rjt