python--文本处理1

时间:2022-12-20 13:49:17
1.字符和字符值之间的转换
内建函数:ord(),chr()
>>> print ord("a")
97
>>> print chr(97)
a
注意:ord();需要双引号或者单引号,chr()不需要
 
chr(n)与str(n)区别
>>> print str(97)
97
>>> print chr(97)
a
chr是将一个小整数作为参数并返回对应ASCII的单字符的字符串
str 能将任何整数作为参数,返回一个该整数的文本形式的字符串
 
2.把一个字符串转换成一个包含各个字符的值得列表
>>> print map(ord,"cao")
[99, 97, 111]
 
3.字符串对齐
string对象的ljust(),rjust,center()要解决的问题
 
>>> print 'he'.center(20,'+')
+++++++++he+++++++++
>>> print 'he'.ljust(20,'+')
he++++++++++++++++++
>>> print 'he'.rjust(20,'+')
++++++++++++++++++he
注意:默认是空格,但是也可以加其他字符的咯;
 
4.去除字符串两端的空格
string对象的lstrip()--去除左端,rstip()-去除右端,strip()--去除首尾两端要的空格解决的问题
>>> a = 'xxxxhe aaxxxxx'
>>> print a.lstrip('x')
he aaxxxxx
>>> print a.rstrip('x')
xxxxhe aa
>>> print a.strip('x')
he aa
注意:默认是去除空格不用加参数
 
5.合并字符串
>>> a = "aa"
>>> b = "bb"
>>> print a+b
aabb
>>> c = a.join(b)
>>> print c
baab
注:join将a中“aa”加入b中的“bb”
 
6.将字符串逐字符或者逐词反转
>>> asting = "abcdef"
>>> revchars = asting[::-1]
>>> print revchars
fedcba
步长为-1的特殊切片法;
 
7.检查字符串中是否包含某字符集合中的字符
def containsAny(seq,aset):
     """检查序列seq是否含有aset中的项"""
     for c in seq:
           if c in aset :return True
     return False
 
8.控制大小写
big   = little.upper()
little = big.lower()
非字母的按照原样复制过来
>>> little="abdsdf23df"
>>> big = little.upper()
>>> print big
ABDSDF23DF
>>> print big.lower()
abdsdf23df
 
利用序列的切割,第一个字符为大写字母,其余改为小写字母
>>> s = "aDFdf34"
>>> print s[:1].upper()+s[1:].lower()
Adfdf34
这个功能可以用s.capitalize()来解决
>>> s = "aDFdf34"
>>> print s.capitalize()
Adfdf34
 
将每个单词的首字母换成大写用s.title()
>>> s = "one two three"
>>> print s.title()
One Two Three