python 内置数据类型之字符串

时间:2021-08-05 08:55:37

1.3 字符串

字符串本身就是一个有序(从左至右)的字符的集合。是序列这种类型的一种,后面还要学习列表与元组。 在这一节中,需要了解字符串的定义,特殊字符,转义与抑制转义;字符串基本操作、格式化等。 先看下面表格,本节学习的主要内容就在下面的表格中:

分类 操作 解释 python2.6 python 3.0
s='' 定义空字符串    
s="halberd's",'halberd\'s' 使用单引号或者双引号定义字符串    
  s="""…"""      
  s=''' …''' 三重引号定义多行字符串    
  s=r'\temp\halberd' 定义raw字符串,取消转义    
  s=b'halberd' python3.0 开始出现,定义字节字符串 N  
  s=u'halberd' 仅在python2.6中使用unicode字符串   N
s1 + s2 字符串合并    
s1 * n 重复 n 次    
s[i] 使用字符串索引,i>=0,为整数。    
s[i:k] 字符串分片,取出从i到k的内容    
len(s) 取字符串的个数    
  s.find('ha') 返回匹配到的内容的索引值    
  s.[l | r]strip() 移除(左 | 右)左右两边的空格    
  s.replace 字符替换    
  s.split(',') 指定分隔符将字符串进行分隔(分隔后变为列表)    
  s.isdigit() 判断是否为整数    
  s.upper()/s.lower() 大小写转换    
  s.endswith('value') 匹配字符串结尾    
  s.join(strlist) 在strlist中以s为分隔符将s插入各个字符之间    
  s.encode('utf8') 指定编码    
  'a' in 'b' 判断 a 是否包含于b    
"a %s parrot" % kind 字符串格式化表达式    
”a {0} parrot".format(kind) 字符串格式化方法    
       
[c*2 for c in s] 迭代,把S中的字符逐一重复2次,并将结果转换为列表    
map(ord,s) 将字符串s中的值逐一传入函数ord(用于置换为ASCII),map把计算结果以列表形式返回结果    
NOTE: 
在python中,单引号与双引号的作用是一样的。
  • 转义及特殊字符

在编写程序的过程中难免会遇到使用特殊字符的情况。对特殊字符的转义及抑制转义需要有所了解。 python中的转义符是 "/" . 可以通过转义符将特殊字符转义,使特殊字符以字符串本身存在。也可以在定义字符串时 通过关键字母 r 来定义为raw-string,如 s=r'halberd\n' ,这种写法,"\n" 会以字符串本身存在,不代表任何特殊意义。

Table 5: 特殊字符及转义符使用示例
示例 意义
\\ 保留\
\' 保留'
\" 保留”
\a 响铃
\b 退格,删除前面一个字符
\f 换页
\n 新起一行
\t 横向制表符
\v 垂直+横向制表符,以上一行为基准
\0 NULL(不是字符串结尾)
\o 八进制
\x 16进制
\U unicode 32位的16进制
\u Unicode 16位的16进制
  • 索引和分片

字符串索引的表示方法为:s[i], s 为字符串变量、常量,i代表索引序号。假设字符串变量s的值被定义为'halberd',即(s='halberd'),则将该值的内容想像为:

h a l b e r d
0 1 2 3 4 5 6
-7 -6 -5 -4 -3 -2 -1

索引的序号与实际的字符串中字符对应关系如上。i=0 ,代表了字符串从左至右数第一个字符,当从左至右对应字符串索引时,序号i的取值范围为0 –> len(s)-1。 i = -1时,从右至左对应字符串索引,i 的取值范围为 -len(s) –> -1.

分片的表示方法为: s[i:j:n]或者s[slice(i,j,n)],取出字符串的索引序号范围为大于等于i 并且小于j, 由前两个参数确定 取值范围后,从第一个值开始,以N 为间隔进行取值。如果n 为负数,则值的显示顺序与原字符串的排列顺序相反。第三个参数 n 可以省略,默认为1. 第二个参数可省略,默认为最后一个字符。

  • 字符串格式化

如今python 中有两路方法来实现字符串格式化: 表达式/ 格式化方法调用。 表达式是python 诞生以来就存在的,而方法调用则是从python2.6开始的。先从表达式开始。 在了解格式化的具体方法之前,先来了解下转换目标。 所谓的转换目标就是要把我们需要的值代入的位置(可以理解为占位符):

Table 6: 转换目标
置换目标 意义
s 字符串
r s,但是使用的是repr,而不是str
c 字符
d 十进制整数
i integer,整数
u unsigned integer,无符号整数
o 八进制整数
x 十六进制整数
X x,输出时为大写
e 浮点指数
E e,输出时为大写
f 浮点十进制数
F f,输出时为大写
g e/f
G E/F
% 常量%

转换目标的结构如下: %[(name)][flags][width].[precise]typecode

%[(name)][stuff-things][position][width].[precise]typecode

其中(name) 需要与字典配合使用,与字典中的name 对应,待学习字典后有更明确的了解。

flags可以有+,-,=,^,' '或0。+表示右对齐。-表示左对齐,=代表一个标记字符后的补充,^ 代表居中。' '为一个空格,表示在正数的左侧填充一个空格,为默认方式, 从而与负数对齐。0表示使用0填充。

width 表示整数部分(包含一切字符)+小数点+小数 各部分字符个数最大显示个数。

precision表示小数点后精度

  • [ ] 表达式 格式以% 为分隔,左侧为包含占位符(%d %s 等)的内容,%右侧为占位符对应的值 。
    'That is %d %s birds!' % (1,dead)
    ’That is %05.2d %s birds!' % (1,dead) -- 试试将05改为5, 将d 改为f 会有什么结果
    'That is %(num)05.2d %(stat)s birds!' % {"stat":'dead',"num":1} -- 试试将单引号去掉,将双引号去掉

    如果在运行时才能计算得出width.precise ,那么可以一预定义格式的时候,在width 与precise 位置上用* 代替. 如: '%f,%.2f,%*.*f' % (1/3.,1/3.,2,4,1/3.)

    一个* ,按出现顺序,要在 % 后面相应顺序位置提供值。 像上面的示例,width = 2 ,precise = 4. 最后一个1/3. 为%*.*f 的值。

    • [ ] 方法调用 方法调用,使用的是string.format 来实现。在string 所代表的字符串中,可以使用{n}(位置参数)或者{key}(名称参数) 作为替换目标。

      结构: 参数书写格式为:{key:[填充字符][对齐方式][宽度][.精度][数据类型]} '参数'.format('value1',key1='value',…….)

      示例:

      >>> '{motto},{0},{1},{food}'.format(1,2,motto='3.14',food=[1,2])
      '3.14,1,2,[1, 2]'

      其中{n}(位置参数) 中,n>=0. {0} 代表{n}中的第一个参数,{1}代表第二个可取参数。 {key}(关键字参数) 与 key=value格式中的key 要一一对应。{n}的值不能在key=value格式中取值。

      note 
      位置参数值不得在名称参数值之后 。
      [ ] (no term) 
      位置参数 示例:
      >>> s=['halberd',18]
      >>> x='My name is {0:10s}, {1:-=10d} years old.'
      >>> x.format('halberd',18)
      'My name is halberd , --------18 years old.'
      ''' 注意下面写法。将列表中的值作为参数值传入字符串参数中。在指向列表的变量前加*
      '''
      >>> 'My name is {}, {} years old.'.format(*s) ''' 注意此种写法: *变量名'''
      'My name is halberd, 18 years old.'
      [ ] (no term) 
      关键字参数 示例:
      >>> x='My name is {name},{age} years old. I\'ve been HZ for {0} years.'
      >>> x.format(8,name='halberd',age=18)
      "My name is halberd,18 years old. I've been HZ for 8 years."
      s={'name':'halberd','age':18,8}
      ''' 注意下面用法. 将字典值作为参数值传入。在字典变量前加** 即可。因为关键词有对应关系,书写顺序对值的对应无影响
      '''
      >>> s={'age':18,'name':'halberd','year':8}
      >>> x='My name is {name},{age} years old. I\'ve been HZ for {year} years.'
      >>> x.format(**s)
      "My name is halberd,18 years old. I've been HZ for 8 years."
      [ ] 填充与格式化
        对齐方式有:
        < 左对齐
        > 右对齐
        = 一个标记字符后的补充(右对齐)
            ^ 居中

对比下下面不同的对齐方式。

>>>s={'age':18,'name':'halberd','year':8}
>>>'''居中对齐'''
'居中对齐'
>>> x='My name is {name},{age:-^10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,----18---- years old. I've been HZ for 8 years."
>>> '''左对齐'''
'左对齐'
>>> x='My name is {name},{age:-<10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,18-------- years old. I've been HZ for 8 years."
>>> x='My name is {name},{age:+=10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,++++++++18 years old. I've been HZ for 8 years."
>>> '''右对齐'''
'右对齐'
>>> x='My name is {name},{age:->10} years old. I\'ve been HZ for {year} years.'
>>> x.format(**s)
"My name is halberd,--------18 years old. I've been HZ for 8 years."
  • [ ] 精度与进制 调用format方法,不能将整数值格式化为浮点数。但是可以转换为其他进制。 字符串不能转换为其他进制。
    # 精度控制
    >>> s=3.1415926
    >>> x='Pi is {:.4f}'
    >>> x.format(s)
    'Pi is 3.1416'
    >>> # 进制转换
    ...
    >>> x='My name is {name},{age:-^10o} years old. I\'ve been HZ for {year} years.'
    >>> x.format(**s)
    "My name is halberd,----22---- years old. I've been HZ for 8 years."