字符串和字符编码

时间:2023-01-10 17:47:26

欢迎阅读本人博客,如有疑问欢迎补充

  • Windows7x64平台下安装python2.x和Python3.x
  • 共存使用Python2.x和Python3.x配置方法

字符串

在python中是没有字符数据类型的,字符串和字符是采用一对单引号''或者一对双引号""括起来进行表示。
例如:

value = 'A'#The same as value = "A"
info = 'Hello,csdn!'#The same as info = "Hello,csdn!"

第一条语句是将字符A赋予变量value,第二条语句是将字符串Hello,csdn!赋予变量info

编码

ASCII码

计算机的内部是使用二进制数的,在计算机中,一个字符被存储为一连串的0和1,把一个字符映射为它对应的二进制被称为字符编码,一般有一个编码表定义编码字符的方式,学过其他语言的应该都知道,通用的流行编码标准是ASCII(美国信息交换标准代码),其中可以表示所有的大小写字母、数字、标点符号以及控制符号。ASCII码使用0-127表示字符。
附ASCII码表参考:ASCIIma

统一码

在python中还支持统一码,也是一种编码表,可以表示国际字符,ASCII码表是统一码的子集。统一码由统一码协会(Unicode Consortium)建立,支持世界上各种语言所写的文本进行交换、处理和展示。
一个统一码以\u开始,后面紧跟四个十六进制数字,从\u0000\uFFFF
例如:

print('\u6B22\u8FCE')

字符串和字符编码

welcome即转为中文是“欢迎”,对应的统一码是“\u6b22\u8fce”。
如果是非安装中文字体的系统可能会出现看不到中文字符的情况,可以查看希腊字母的统一码“\u03b1”,可以看到对应的字母“α”。

程序中中文字符可用

不少新手在刚接触编程时习惯使用中文进行注释等操作,但是python是不能直接符合中文显示的,所以需要在代码开头加入满足的编码格式:

#-*-encoding:utf-8-*-