Python之反射，正则

本节主要内容：

　　　　　　一. 反射：

　　　　　　　　　　getattr

　　　　　　　　　　hasattr

　　　　　　　　　　setattr

　　　　　　　　　　defattr

　　　　　　二. 补充模块中特殊的变量

　　　　　　三. 正则表达式

　　　　　　　　　　re模块

（一）反射：

hasattr(object, name) 检查
getattr(object, name) 寻找
setattr(object, name, value) 设置　　　　　　
delattr(object, name) 删除

说明：判断对象object是否包含名为name的特性（hasattr是通过调用getattr(ojbect, name)是否抛出异常来实现的）。

参数object：对象。

参数name：特性名称。

#利用字符串的形式去对象（模块）中操作（寻找，检查，设置，删除）成员。

例子：

 #模拟网站不同url访问不同页面

 ##commons.py

 def login():

     print("登陆页面")

 def logout():

     print("退出页面")

 def home():

     print("主页面")

 ##index

 import commons

 #利用字符串的形式去对象（模块）中操作（寻找）成员。

 def run():

     inp = input("请输入要访问的页面：")

     if hasattr(commons,inp):

         func = getattr(commons,inp)

         func()

     else:

         print("")

 if __name__ == '__main__':

     run()

 #输出：

 请输入要访问的页面：login

 登陆页面

 请输入要访问的页面：home

 主页面

 请输入要访问的页面：fsdfsf

 404

##模块实现反射

 ##index.py

 def run():

     #account/login

     inp = input("请输入要访问的url:")

     m, f = inp.split('/')   #m为模块，f模块中函数，中间用/分隔

     obj = __import__(m)

     if hasattr(obj, f):

         func = getattr(obj, f)

         func()

     else:

         print("")

 if __name__ == '__main__':

     run()

 ##account.py

 def login():

     print("登陆页面")

 def logout():

     print("退出页面")

 ##manager.py

 def order():

     print("订单页面")

 #输出：

 请输入要访问的url:account/login

 登陆页面

 请输入要访问的url:manager/order

 订单页面

 请输入要访问的url:account/sfdsdf

 404

##模块多层目录时，可使用fromlist = True

 ##lib/test/account.py  #多层级目录

  m, f = inp.split('/')

  obj = __import__("lib." + m ,fromlist = True)

 #目录加.(点)，后+模块，fromlist = True

（二）补充模块中特殊的变量

　　　　　__doc__: 显示注释信息

　　　　　__cached__: pyc文件路径

　　　　　__file__: 当前py文件所在路径

　　　　　　　　　　os.path.dirname: 找到某个文件的上级目录

　　　　　　　　　　os.path.abspath: 获取某个文件的绝对路径

 import os,sys

 #sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

 print(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

 #输出：

 D:\python程序\s13\day6\模块  #输出file绝对路径的上级目录的上级目录

#注：一般可执行文件都需要加入。

　　　　__package__: 查找模块在哪个目录，当前目录使用返回None

　　　　__name__:

　　　　　　如果我们是直接执行某个.py文件的时候，该文件中那么”__name__ == '__main__'“是True,但是我们如果从另外一个.py文件通过import导入该文件的时候，这时__name__的值就是我们这个py文件的名字而不是__main__。

　　　　　　这个功能还有一个用处：调试代码的时候，在”if __name__ == '__main__'“中加入一些我们的调试代码，我们可以让外部模块调用的时候不执行我们的调试代码，但是如果我们想排查问题的时候，直接执行该模块文件，调试代码能够正常运行！

　　　　hashlib : 用于加密相关的操作，代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法.

 import hashlib

 obj = hashlib.md5(bytes('3454abdFdf', encoding='utf-8'))

 obj.update(bytes('admin',encoding='utf-8'))

 print(obj.hexdigest())

　　　　三. 正则表达式(re)

　　　　　　　正则表达式(re)是由一些字符和特殊符号组成的字符串，通过某个模式匹配到有相似特征的字符串，可以是单个也可以是多个。

　　　　　　　　　　　　　　　　正则表达式使用的特殊符合和字符

Python之反射，正则

　　re模块：

　　　　　　最常用的几个方法：

　　　　　　　　　　compile(pattern,flages=0): 对正则表达式模式pattern进行编译，flags为可选标志符，并返回一个regex对象

　　　　　　　　　　match(pattern,string, flages=0) : 尝试用正则表达式模式pattern匹配字符串string，flages可选标志符，如果匹配成功返回匹配对象，否则返回None.

　　　　　　　　　　search(pattern,string, flages=0) : 在字符串string中查找正则表达式模式pattern的第一次出现，匹配成功，返回匹配对象，否则为None。

　　　　　　　　　 findall(pattern,string[,flages]): 在字符串string中查找正则表达式模式pattern的所有(非重复)出现：返回一个匹配对象的列表。

　　　　　　　　　　finditer(pattern,string[,flages]): 和findall相同，但返回的是一个迭代器而不是一个列表，对于每个匹配，该迭代器返回一个匹配对象。

　　　　　　　　　　split(pattern,string, max=0): 根据正则表达式pattern中的分隔符把字符string分割为一个列表，返回成功匹配的列表，最多分割max次(默认分割所有匹配过的地方)

　　　　　　　　　　sub(pattern, repl, string, max=0) : 把字符串string中所有匹配正则表达式pattern的地方替换成字符串repl，如果max的值没有给出，默认对所有匹配到的地方进行替换。与sub相同的subn()则会返回一个表示替换次数的数值。

　　　　　　　　　　group(num=0) : 返回所有匹配对象(或指定编号是num的子组)

　　　　　　　　　　groups() : 返回一个包含全部匹配的子组的元组(如果没有成功匹配，则返回一个空的元组)

###match(): 匹配字符串

 #####match#####

 import re

 m = re.match('foo','foo')  #模式匹配字符串

 if m is not None:        #如果不为None，则成功显示foo

     print(m.group())

     print(m)                #返回一个匹配对象的实例。

 #虽然定义字符串长，但是匹配是从开头匹配，成功则返回。否则报错。

 m1 = re.match('foo','food on the table').group()

 print(m1)

 #输出：

 foo

 <_sre.SRE_Match object; span=(0, 3), match='foo'>

 foo

###search() : 在一个字符串中查找一个模式

 #####search#####

 m = re.match('foo','seafood').group()#匹配不到会抛出异常

 print(m)

 m = re.search('foo', 'seafood').group()#可以匹配任意位置

 print(m)

 输出：

 AttributeError: 'NoneType' object has no attribute 'group'

 foo

###findall()：找到每个出现的匹配部分

 #####findall#####

 print(re.findall('car','car'))

 print(re.findall('car','mycar'))

 print(re.findall('car','carry the barcardi to the car'))

 #输出：

 ['car']

 ['car']

 ['car', 'car', 'car']

注意：

　　　findall()与search()相同的是二者都可在任意位置执行字符串搜索，findall()与search(),match()不同之处，findall()总返回一个列表，没有匹配则返回空列表，匹配到，返回所有匹配部分(从左到右)。

###sub()[subn()]: 进行搜索和替换

 #####sub,subn#####

 print(re.sub('hongfei','zhaohongfei', 'My name is hongfei'))

 #匹配到hongfei并替换为zhaohongfei

 print(re.subn('hongfei','zhaohongfei', 'My name is hongfei'))

 #与sub相同，但是返回一个元组，并记录匹配次数

 print(re.sub('[abc]','ABC','gtdacf'))#多个元素匹配

 print(re.subn('[abc]','ABC','gtdacf'))

 #输出：

 My name is zhaohongfei

 ('My name is zhaohongfei', 1)

 gtdABCABCf

 ('gtdABCABCf', 2)

###split()：分割

 #####split()#####

 print(re.split(':','zhao:hong:fei')) #以分号分割字符串

 print(re.split(':','zhao:hongfei'))

 #输出：

 ['zhao', 'hong', 'fei']

 ['zhao', 'hongfei']

###group(), groups()

 #####group, groups#####

 import re

 ###group

 a = "123abc456"

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0))   #123abc456,返回整体

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1))   #

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2))   #abc

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3))   #

 ###gorups   #都是返回整体

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(0))

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(1))

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(2))

 print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(3))  

 #输出:

 123abc456

 123

 abc

 456

 ('', 'abc', '') #由此可以看到groups为返回匹配的整体

 ('', 'abc', '')

 ('', 'abc', '')

 ('', 'abc', '')

1. 正则表达式中的三组括号把匹配结果分成三组

group() 同group（0）就是匹配正则表达式整体结果
group(1) 列出第一个括号匹配部分，group(2) 列出第二个括号匹配部分，group(3) 列出第三个括号匹配部分。

2. 没有匹配成功的，re.search（）返回None

3. groups为返回匹配到的整体的一个元组。

以上为所学内容总结，后续会继续完善，谢谢！

秒客网

Python之反射，正则

相关文章