python学习第十八天计算机字符编码

时间:2022-04-19 10:56:42

人类语言和计算机语言二进制怎么沟通,最开始字符编码为ascii码对照表 包括数据和字母,没有汉字,中国自己搞了一套自己的编码 gb2312编码后来发展GBK编码,日本,韩国都,甚至*也搞自己的编码,最后国际统一一个编码为unicode 编码

但是unicode编码统一占两个字符,英文占一个字符,中文占两个字符,泰文占3个字符,后来发展 演变 统一 UTF格式 utf-8,这种可长可短的,比较适合所有国家的编码方式。

1,二进制

0,1 二进制

0,1,2,3,4,5,6,7 八进制

0.1.2.3,4,5,6,7,8,9 十进制

0.1.2.3,4,5,6,7,8,9,a,b,c,d,e,f 十六进制

2,进制的内置方法函数

二进制 bin()

八进制 oct()

十进制 int()

十六进制 hex()

3,编码函数

decode 解码函数 utf-8 转换 unicode

encode 编码函数 unicode 转换 gbk ,utf8 ,其他编码格式

4,python3默认支持utt-8格式,不需要写 #encoding:utf-8,但是python2默认支持unicode格式

文章来自(玖乐网络 http://www.96net.com.cn/)