常用编码格式以及存储大小单位换算

时间:2024-03-14 22:53:39

心得:马云所说:"工作是水,生活是酒。水会决定酒的质量,但生活,要过得像酒一样,不可以像水一样,沒有味道。"但我更在意酒的质量.

编码格式
我们都知道计算的编码类型是0和1,但具体怎么运行的我们也看不到,我们生活中常常接触到的是各式各样的字符,那我们这些字符和对应的0和1是怎么转换的,其实每一种字符都可以用二进制数表示,例如小写英文字母,数字等等,都属于ASCII码,但ASCII码是用一个字节七位表示的,也就是说,它最大表示的个数为2^7也就是128种字符。但每种语言都是不同的字符,这得需要同一的编码格式大家才能有效的和计算机交流。看看常用的编码都有那些吧。

ASCII码
它是用一个字节中的七位表示,共有128个,包括各种字符。也是常用的一种,但依然不够用。

ISO-8859-1
产生了ISO-8859-1格式,它是用一个字节八位表示,有2^8也就是256种,相当于ASCII码的扩展码,涵盖了大多数西欧语言字符,计算机内部常用。

GB2313/GBK
国标汉字的表示扩展规范,GBK是采用单双字节变长编码,英文使用单字节编码,完全兼容ASCII字符编码,中文部分采用双字节编码。

Unicode
统一码,万国码,两个字节表示一个字符。缺陷占用空间。
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。目前的Unicode字符分为17组编排,0x0000 至 0x10FFFF,每组称为平面(Plane),而每平面拥有65536个码位,共1114112个。

UFT-8编码
UTF-8是以字节单位对Unicode编码,第0-127位字符使用1个字节来表示(单个字母、数字符号等)和ASCII编码相同,其中大部分汉字采用三个字节编码。从128号之后开始根据字符选择要使用的字节位数。因此UTF-8被称为可变长编码。

UTF-16

UTF-16编码以16位无符号整数为单位,使用二或四个字节为每个字符编码,其中大部分汉字采用两个字节编码。与UTF-8相比虽然表示的方法简单方便,有很大一部分字符用一个字节就可以表示的现在要用两个字节表示,有占有的存储空间放大一倍,会增大网络传输的流量,而且没必要这么做。
常用编码格式以及存储大小单位换算

再看一下字节/位的换算单位。
字节,比特的单位
b bit 位/比特
B Byte 字节
1 Byte = 8 bit
我们平时的大小,一定要看清楚单位是B字节还是b比特,两者相差8倍
1M=1024k
1G=1024M
1T=1024G