字符集(Charset):一组抽象字符的集合
字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。 字符集常常和一种具体的语言文字对应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符集。
字符编码(Encoding):计算机要处理各种字符,字符编码将字符和二进制内码对应起来
制定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制数字对应起来。根据字符集内字符的多少,会确定用几个字节来编码。 每种编码都限定了一个明确的字符集合。
字符集有:ASCII、unicode等
对于unicode字符集,有utf8,utf16,utf32等多种编码方式
zh_cn:不是字符编码而是语言代码