1.3 字符串
字符串本身就是一个有序(从左至右)的字符的集合。是序列这种类型的一种,后面还要学习列表与元组。 在这一节中,需要了解字符串的定义,特殊字符,转义与抑制转义;字符串基本操作、格式化等。 先看下面表格,本节学习的主要内容就在下面的表格中:
分类 | 操作 | 解释 | python2.6 | python 3.0 |
---|---|---|---|---|
定 | s='' | 定义空字符串 | ||
义 | s="halberd's",'halberd\'s' | 使用单引号或者双引号定义字符串 | ||
s="""…""" | ||||
s=''' …''' | 三重引号定义多行字符串 | |||
s=r'\temp\halberd' | 定义raw字符串,取消转义 | |||
s=b'halberd' | python3.0 开始出现,定义字节字符串 | N | ||
s=u'halberd' | 仅在python2.6中使用unicode字符串 | N | ||
字 | s1 + s2 | 字符串合并 | ||
符 | s1 * n | 重复 n 次 | ||
串 | s[i] | 使用字符串索引,i>=0,为整数。 | ||
操 | s[i:k] | 字符串分片,取出从i到k的内容 | ||
作 | len(s) | 取字符串的个数 | ||
s.find('ha') | 返回匹配到的内容的索引值 | |||
s.[l | r]strip() | 移除(左 | 右)左右两边的空格 | |||
s.replace | 字符替换 | |||
s.split(',') | 指定分隔符将字符串进行分隔(分隔后变为列表) | |||
s.isdigit() | 判断是否为整数 | |||
s.upper()/s.lower() | 大小写转换 | |||
s.endswith('value') | 匹配字符串结尾 | |||
s.join(strlist) | 在strlist中以s为分隔符将s插入各个字符之间 | |||
s.encode('utf8') | 指定编码 | |||
'a' in 'b' | 判断 a 是否包含于b | |||
格 | "a %s parrot" % kind | 字符串格式化表达式 | ||
式 | ”a {0} parrot".format(kind) | 字符串格式化方法 | ||
化 | ||||
迭 | [c*2 for c in s] | 迭代,把S中的字符逐一重复2次,并将结果转换为列表 | ||
代 | map(ord,s) | 将字符串s中的值逐一传入函数ord(用于置换为ASCII),map把计算结果以列表形式返回结果 |
- NOTE:
- 在python中,单引号与双引号的作用是一样的。
-
- 转义及特殊字符
在编写程序的过程中难免会遇到使用特殊字符的情况。对特殊字符的转义及抑制转义需要有所了解。 python中的转义符是 "/" . 可以通过转义符将特殊字符转义,使特殊字符以字符串本身存在。也可以在定义字符串时 通过关键字母 r 来定义为raw-string,如 s=r'halberd\n' ,这种写法,"\n" 会以字符串本身存在,不代表任何特殊意义。
Table 5: 特殊字符及转义符使用示例 示例 意义 \\ 保留\ \' 保留' \" 保留” \a 响铃 \b 退格,删除前面一个字符 \f 换页 \n 新起一行 \t 横向制表符 \v 垂直+横向制表符,以上一行为基准 \0 NULL(不是字符串结尾) \o 八进制 \x 16进制 \U unicode 32位的16进制 \u Unicode 16位的16进制 -
- 索引和分片
字符串索引的表示方法为:s[i], s 为字符串变量、常量,i代表索引序号。假设字符串变量s的值被定义为'halberd',即(s='halberd'),则将该值的内容想像为:
h a l b e r d 0 1 2 3 4 5 6 -7 -6 -5 -4 -3 -2 -1 索引的序号与实际的字符串中字符对应关系如上。i=0 ,代表了字符串从左至右数第一个字符,当从左至右对应字符串索引时,序号i的取值范围为0 –> len(s)-1。 i = -1时,从右至左对应字符串索引,i 的取值范围为 -len(s) –> -1.
分片的表示方法为: s[i:j:n]或者s[slice(i,j,n)],取出字符串的索引序号范围为大于等于i 并且小于j, 由前两个参数确定 取值范围后,从第一个值开始,以N 为间隔进行取值。如果n 为负数,则值的显示顺序与原字符串的排列顺序相反。第三个参数 n 可以省略,默认为1. 第二个参数可省略,默认为最后一个字符。
- 字符串格式化
-
如今python 中有两路方法来实现字符串格式化: 表达式/ 格式化方法调用。 表达式是python 诞生以来就存在的,而方法调用则是从python2.6开始的。先从表达式开始。 在了解格式化的具体方法之前,先来了解下转换目标。 所谓的转换目标就是要把我们需要的值代入的位置(可以理解为占位符):
Table 6: 转换目标 置换目标 意义 s 字符串 r s,但是使用的是repr,而不是str c 字符 d 十进制整数 i integer,整数 u unsigned integer,无符号整数 o 八进制整数 x 十六进制整数 X x,输出时为大写 e 浮点指数 E e,输出时为大写 f 浮点十进制数 F f,输出时为大写 g e/f G E/F % 常量% 转换目标的结构如下: %[(name)][flags][width].[precise]typecode
%[(name)][stuff-things][position][width].[precise]typecode
其中(name) 需要与字典配合使用,与字典中的name 对应,待学习字典后有更明确的了解。
flags可以有+,-,=,^,' '或0。+表示右对齐。-表示左对齐,=代表一个标记字符后的补充,^ 代表居中。' '为一个空格,表示在正数的左侧填充一个空格,为默认方式, 从而与负数对齐。0表示使用0填充。
width 表示整数部分(包含一切字符)+小数点+小数 各部分字符个数最大显示个数。
precision表示小数点后精度
-
[ ]
表达式 格式以% 为分隔,左侧为包含占位符(%d %s 等)的内容,%右侧为占位符对应的值 。'That is %d %s birds!' % (1,dead)
’That is %05.2d %s birds!' % (1,dead) -- 试试将05改为5, 将d 改为f 会有什么结果
'That is %(num)05.2d %(stat)s birds!' % {"stat":'dead',"num":1} -- 试试将单引号去掉,将双引号去掉如果在运行时才能计算得出width.precise ,那么可以一预定义格式的时候,在width 与precise 位置上用* 代替. 如: '%f,%.2f,%*.*f' % (1/3.,1/3.,2,4,1/3.)
一个* ,按出现顺序,要在 % 后面相应顺序位置提供值。 像上面的示例,width = 2 ,precise = 4. 最后一个1/3. 为%*.*f 的值。
-
[ ]
方法调用 方法调用,使用的是string.format 来实现。在string 所代表的字符串中,可以使用{n}(位置参数)或者{key}(名称参数) 作为替换目标。结构: 参数书写格式为:{key:[填充字符][对齐方式][宽度][.精度][数据类型]} '参数'.format('value1',key1='value',…….)
示例:
>>> '{motto},{0},{1},{food}'.format(1,2,motto='3.14',food=[1,2])
'3.14,1,2,[1, 2]'其中{n}(位置参数) 中,n>=0. {0} 代表{n}中的第一个参数,{1}代表第二个可取参数。 {key}(关键字参数) 与 key=value格式中的key 要一一对应。{n}的值不能在key=value格式中取值。
- note
- 位置参数值不得在名称参数值之后 。
-
[ ]
(no term) - 位置参数 示例:
>>> s=['halberd',18]
>>> x='My name is {0:10s}, {1:-=10d} years old.'
>>> x.format('halberd',18)
'My name is halberd , --------18 years old.'
''' 注意下面写法。将列表中的值作为参数值传入字符串参数中。在指向列表的变量前加*
'''
>>> 'My name is {}, {} years old.'.format(*s) ''' 注意此种写法: *变量名'''
'My name is halberd, 18 years old.' -
[ ]
(no term) - 关键字参数 示例:
>>> x='My name is {name},{age} years old. I\'ve been HZ for {0} years.'
>>> x.format(8,name='halberd',age=18)
"My name is halberd,18 years old. I've been HZ for 8 years."
s={'name':'halberd','age':18,8}
''' 注意下面用法. 将字典值作为参数值传入。在字典变量前加** 即可。因为关键词有对应关系,书写顺序对值的对应无影响
'''
>>> s={'age':18,'name':'halberd','year':8}
>>> x='My name is {name},{age} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,18 years old. I've been HZ for 8 years." -
[ ]
填充与格式化 - 对齐方式有:
- < 左对齐
- > 右对齐
- = 一个标记字符后的补充(右对齐)
- ^ 居中
-
-
对比下下面不同的对齐方式。
>>>s={'age':18,'name':'halberd','year':8}
>>>'''居中对齐'''
'居中对齐'
>>> x='My name is {name},{age:-^10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,----18---- years old. I've been HZ for 8 years."
>>> '''左对齐'''
'左对齐'
>>> x='My name is {name},{age:-<10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,18-------- years old. I've been HZ for 8 years."
>>> x='My name is {name},{age:+=10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,++++++++18 years old. I've been HZ for 8 years."
>>> '''右对齐'''
'右对齐'
>>> x='My name is {name},{age:->10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,--------18 years old. I've been HZ for 8 years."
-
[ ]
精度与进制 调用format方法,不能将整数值格式化为浮点数。但是可以转换为其他进制。 字符串不能转换为其他进制。# 精度控制
>>> s=3.1415926
>>> x='Pi is {:.4f}'
>>> x.format(s)
'Pi is 3.1416'
>>> # 进制转换
...
>>> x='My name is {name},{age:-^10o} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,----22---- years old. I've been HZ for 8 years."