Python基础:数据类型-字符串(7)

时间:2023-01-11 14:44:45

1.字符串基本操作

  字符串是由字符组成的一串字符序列,字符串是有顺序的,从左到右,索引从0开始,依次递增。

  Python中字符串类型:str。

  Python中字符串的三种表示方式:

  (1)普通字符串:采用单引号(')或双引号(")括起来的字符串。

  (2)原始字符串(raw string):在普通字符串的前面加 r,字符串中的特殊字符不需要转义。

  (3)长字符串:字符串中包含换行、缩进等排版字符,使用三重单引号(''')或三重双引号(""")括起来的字符串。

1.1 普通字符串

  Python中字符串采用Unicode编码。

>>> s='Hello World!'
>>> s
'Hello World!'

  转义字符:

转义字符 描述
\(在行尾时) 换行
\t 水平制表符
\n 换行
\r 回车
\" 双引号
\' 单引号
>>> s='Hello\tWorld!'
>>> print(s)
Hello World!

1.2 原始字符串

  原始字符串:在普通字符串前面加 r。原始字符串可以直接按照字符串使用,没有转义符。

>>> s=r'Hello\tWorld!'
>>> print(s)
Hello\tWorld!

1.3 长字符串

  长字符串可以包含换行、缩进等排版字符。

>>> s='''Hello
... World!'''
>>> print(s)
Hello
World!

2.字符串格式化

  Python提供3种字符串格式化方法:

  (1)%运算符

  (2)内置函数format()

  (3)创建字符串对象配合format(),使用{}进行替换

2.1 %运算符 — 格式字符串

  语法:

%[flag][width][.precision]

  其中,%:标记转换说明符开始

     flag:转换标记

     width:最小宽度,转换后的值所保留的最小字符个数。如果是*,则宽度从值元组中读取。

     precision:精度,如果转换的实数,精度表示出现在小数点后的位数;如果转换的是字符串,则表示最大宽度。如果是*,则精度从值元组中读取。

  宽度和精度都是整数,通过点号(.)分隔。两个都是可选参数,如果给出精度,则必须包含点号。

  转换类型:

符号 描述 符号 描述
%c 格式化字符及其ASCII码 %s 格式化字符串
%d 格式化整型 %u 格式化无符号整型
%o 格式化无符号八进制数 %x,%X 格式化无符号十六进制
%f 格式化浮点数字,可指定精度值 %e,%E 用科学计数法格式化浮点数
%g,%G %f和%e的简写,十进制整数或浮点数。 %% 输出数据时显式百分号
%r 使用repr()函数输出    

  转换标志(flag):

符号 描述 符号 描述
'#' 十六、八进制进行转换时,可在前方补0。 '0' 数值前补0
'-' 靠左对齐,若与0同时使用,会优先于0。 '' 保留一个空格
> 靠右对齐 < 靠左对齐
+ 在转换值前加正负号    
>>> '%c'%97 # ASCII码输出字符
'a'
>>> '年同比变化:%.2f%%'%120.987 # 输出百分号
'年同比变化:120.99%'
>>> '%o'%10 # 转换八进制数
''
>>> '%#o'%10 # 转换补0八进制数
'0o12'
>>> '%x'%127 # 转换十六进制数
'7f'
>>> '%#x'%127 # 转换补0十六进制数
'0x7f'
>>> from math import pi
>>> '%010.5f'%pi # pi转换:带5位小数、长度为10、位数不足0填充的字符串
'0003.14159'
>>> s = '%-10.5f'%pi # 左对齐
>>> s
'3.14159 '
>>> len(s)
10
>>> s = '%-010.5f'%pi # -优先于0
>>> s
'3.14159 '
>>> '%10.5f'%pi # 空格填充
' 3.14159'
>>> '%-+10.5f'%pi # 左对齐显示正负符号
'+3.14159 '
>>> '%+-10.5f'%pi # 左对齐显示正负符号
'+3.14159 '
>>> '%-+10.5f'%-pi # 左对齐显示正负符号
'-3.14159 '
>>> '%3.5f'%pi #最小宽度 < 实际宽度,显示实际宽度
'3.14159'
>>> '%.5s'%('Hello World') # 字符串精度值:最大宽度
'Hello'
>>> s = '%10.5s'%('Hello World') # 字符串截取最大宽度后空格填充
>>> s
' Hello'
>>> len(s)
10
>>> '%.*s'%(5,'Hello World') # 精度从元组中读取
'Hello'
>>> '%*.*s'%(10,5,'Hello World') # 宽度、精度从元组中读取
' Hello'

2.2 内置函数format()

>>> '{:,}'.format(10000) # 千分位
'10,000'

3.字符串方法

3.1 find()方法

  find()方法:用于检测字符串中是否包含子字符串sub。如果指定start(开始)和end(结束),则在指定范围内检测。

        如果包含子字符串,返回开始的索引;否则返回-1。

  find()语法:

str.find(sub[, start[, end]])

  其中,sub:指定检测的子字符串,

     start:开始索引,默认为0;

     end:结束索引,默认为字符串的长度。

  返回结果为子字符串所在位置的最左端索引,如果没有找到,则返回-1。

  help查看find()方法定义:

>>> help(str.find)
Help on method_descriptor: find(...)
S.find(sub[, start[, end]]) -> int Return the lowest index in S where substring sub is found,
such that sub is contained within S[start:end]. Optional
arguments start and end are interpreted as in slice notation. Return -1 on failure.

  rfind()方法:与find()方法类似,区别是找到返回最右端位置的索引。

>>> help(str.rfind)
Help on method_descriptor: rfind(...)
S.rfind(sub[, start[, end]]) -> int Return the highest index in S where substring sub is found,
such that sub is contained within S[start:end]. Optional
arguments start and end are interpreted as in slice notation. Return -1 on failure.
>>> field = 'Hello World'
>>> field.find('o')
4
>>> field.rfind('o')
7
>>> field.find('o',5) # 指定开始索引
7
>>> field.find('a') # 未找到则返回-1
-1
>>> words = 'Where there is a will,there is a way.'
>>> len(words)
37
>>> words.find('is')
12
>>> words.rfind('is')
28

Python基础:数据类型-字符串(7)

3.2 join()方法

  join()方法:用于将序列中的元素以指定字符连接成一个新的字符串。

  join()语法:

str.join(seq)

  其中,str:指定字符

     seq:待连接的元素序列

     返回结果:指定字符连接序列中元素后生成的新字符串

>>> dirs = ['','usr','bin','python3']
>>> mark = '/'
>>> mark.join(dirs)
'/usr/bin/python3'

4.字符串与数字相互转换

4.1 字符串转换数字

  int()或float():字符串转换数字,如果转换成功,则返回数字;否则引发异常。

>>> int('9')
9
>>> int('9.6')
Traceback (most recent call last):
File "<pyshell#11>", line 1, in <module>
int('9.6')
ValueError: invalid literal for int() with base 10: '9.6'
>>> float('9.6')
9.6

  默认情况下int()函数都将字符串参数作为十进制数字进行转换,可以指定基数(进制)。

>>> int('a')
Traceback (most recent call last):
File "<pyshell#12>", line 1, in <module>
int('a')
ValueError: invalid literal for int() with base 10: 'a'
>>> int('a',16)
10
>>> int('ab',16)
171
>>> int('h',16)
Traceback (most recent call last):
File "<pyshell#15>", line 1, in <module>
int('h',16)
ValueError: invalid literal for int() with base 16: 'h'

4.2 数字转换字符串

  数字转换字符串有很多方法,另外Python中字符串提供str()函数。

>>> str(9.6)
'9.6'
>>> str(True)
'True'
>>> str([1,2,3])
'[1, 2, 3]'

  str()函数所有类型都可以转换,但缺点是不能格式化。如果格式化字符串可以使用format()函数。

>>> from math import pi
>>> '{:.2f}'.format(pi)
'3.14'