一:is 和 == 的区别
01)a b 两个变量 is 是比较变量的内存地址,如果地址相等,则返回True,如果不相等,则返回False == 是比较变量两边内容是否一样,如果一样则返回True,不相等则返回False 02)小数据池的作用,快速建立字符串,节省内存,(缓存)
二:编码:
00):编码 ASCII码 8位(8bit) 1byte GBK码 16bit(16位) 2byte (两个字节) unicode 32bit(32位) 4byte(4个字节) utf—8 24bit(24位) 3byte(三个字节)最小字符占8位
01:编码解码(重点:####)英文转换(英文编码之后的结果和原字符串一样) bytes的表现形式:英文字母的表现形式: # s="tom" # print(s.encode("utf-8")) #打印结果: b'tom' # print(s.encode("GBK")) #打印结果: b'tom'
02:中文转换(utf-8的编码是3个字节(3个bytes),一个GBK的中文编码是2个字节) #编码之后是bytes类型,python保存和传送给对方时用的的是bytes类型,对方接受 的是也是bytes类型, #那么需要将bytes转换为我们常见的类型!() # s="中" # print(s.encode("utf-8")) #打印结果:b'\xe4\xb8\xad' # print(s.encode("GBK")) #打印结果:b'\xd6\xd0'
03:编码转换 # s="许先生" # print(s.encode("utf-8")) #打印:b'\xe8\xae\xb8\xe5\x85\x88\xe7\x94\x9f'(将字符转换为utf-8 格式) # # print(b'\xe8\xae\xb8\xe5\x85\x88\xe7\x94\x9f'.decode("utf-8")) # 打印:许先生
04: 编码转换:(这个知识点) # s="一句唐诗" #将GBK类型转换为utf-8类型,可以先将GBK转换为unicode类型,再转换为utf-8类型 # ss=s.encode("GBK") #1:获得GBK源码 #print(ss)将字符串转换为GBK ,获得源码,打印:b'\xd2\xbb\xbe\xe4\xcc\xc6\xca\xab' # sss=b'\xd2\xbb\xbe\xe4\xcc\xc6\xca\xab'.decode("GBK") #将GBK源码解码获得字符串 #print(sss) 打印结果:一句唐诗 # ssss=sss.encode("utf-8") #将GBK 转换为utf-8类型 print(ssss) 打印:b'\xe4\xb8\x80\xe5\x8f\xa5\xe5\x94\x90\xe8\xaf\x97'