Python之反射,正则

时间:2021-07-19 20:08:04

本节主要内容:

      一. 反射:

          getattr

          hasattr

          setattr

          defattr

      二. 补充模块中特殊的变量

      三. 正则表达式

          re模块

(一)反射:

  • hasattr(object, name)    检查
  • getattr(object, name)    寻找
  • setattr(object, name, value)    设置      
  • delattr(object, name)    删除

说明:判断对象object是否包含名为name的特性(hasattr是通过调用getattr(ojbect, name)是否抛出异常来实现的)。

参数object:对象。

参数name:特性名称。

#利用字符串的形式去对象(模块)中操作(寻找,检查,设置,删除)成员。

例子:

 #模拟网站不同url访问不同页面

 ##commons.py

 def login():
print("登陆页面") def logout():
print("退出页面") def home():
print("主页面") ##index import commons #利用字符串的形式去对象(模块)中操作(寻找)成员。
def run():
inp = input("请输入要访问的页面:") if hasattr(commons,inp):
func = getattr(commons,inp)
func()
else:
print("") if __name__ == '__main__':
run() #输出: 请输入要访问的页面:login
登陆页面
请输入要访问的页面:home
主页面
请输入要访问的页面:fsdfsf
404

##模块实现反射

 ##index.py

 def run():
#account/login
inp = input("请输入要访问的url:") m, f = inp.split('/') #m为模块,f模块中函数,中间用/分隔
obj = __import__(m)
if hasattr(obj, f):
func = getattr(obj, f)
func()
else:
print("")
if __name__ == '__main__':
run() ##account.py def login():
print("登陆页面") def logout():
print("退出页面") ##manager.py def order():
print("订单页面") #输出: 请输入要访问的url:account/login
登陆页面
请输入要访问的url:manager/order
订单页面
请输入要访问的url:account/sfdsdf
404

##模块多层目录时,可使用fromlist = True

 ##lib/test/account.py  #多层级目录

  m, f = inp.split('/')
obj = __import__("lib." + m ,fromlist = True)
#目录加.(点),后+模块,fromlist = True

( 二) 补充模块中特殊的变量

     __doc__: 显示注释信息

     __cached__:  pyc文件路径

     __file__: 当前py文件所在路径

          os.path.dirname: 找到某个文件的上级目录

          os.path.abspath: 获取某个文件的绝对路径

 import os,sys

 #sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

 print(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

 #输出:

 D:\python程序\s13\day6\模块  #输出file绝对路径的上级目录的上级目录

#注: 一般可执行文件都需要加入。

    __package__:  查找模块在哪个目录,当前目录使用返回None

    __name__:

      如果我们是直接执行某个.py文件的时候,该文件中那么”__name__ == '__main__'“是True,但是我们如果从另外一个.py文件通过import导入该文件的时候,这时__name__的值就是我们这个py文件的名字而不是__main__。

      这个功能还有一个用处:调试代码的时候,在”if __name__ == '__main__'“中加入一些我们的调试代码,我们可以让外部模块调用的时候不执行我们的调试代码,但是如果我们想排查问题的时候,直接执行该模块文件,调试代码能够正常运行!

    hashlib :  用于加密相关的操作,代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法.

 import hashlib

 obj = hashlib.md5(bytes('3454abdFdf', encoding='utf-8'))
obj.update(bytes('admin',encoding='utf-8'))
print(obj.hexdigest())

    三.  正则表达式(re)

        正则表达式(re)是由一些字符和特殊符号组成的字符串,通过某个模式匹配到有相似特征的字符串,可以是单个也可以是多个。

                正则表达式使用的特殊符合和字符

Python之反射,正则

Python之反射,正则

Python之反射,正则

Python之反射,正则

Python之反射,正则

  re模块:

      最常用的几个方法:

          compile(pattern,flages=0):   对正则表达式模式pattern进行编译,flags为可选标志符,并返回一个regex对象

          match(pattern,string, flages=0)  : 尝试用正则表达式模式pattern匹配字符串string,flages可选标志符,如果匹配成功返回匹配对象,否则返回None.

          search(pattern,string, flages=0)  : 在字符串string中查找正则表达式模式pattern的第一次出现,匹配成功,返回匹配对象,否则为None。

           findall(pattern,string[,flages]): 在字符串string中查找正则表达式模式pattern的所有(非重复)出现: 返回一个匹配对象的列表。

          finditer(pattern,string[,flages]): 和findall相同,但返回的是一个迭代器而不是一个列表,对于每个匹配,该迭代器返回一个匹配对象。

          

          split(pattern,string, max=0):  根据正则表达式pattern中的分隔符把字符string分割为一个列表,返回成功匹配的列表,最多分割max次(默认分割所有匹配过的地方)

          sub(pattern, repl, string, max=0) :  把字符串string中所有匹配正则表达式pattern的地方替换成字符串repl,如果max的值没有给出,默认对所有匹配到的地方进行替换。与sub相同的subn()则会返回一个表示替换次数的数值。

          

          group(num=0) :   返回所有匹配对象(或指定编号是num的子组)

          groups()  : 返回一个包含全部匹配的子组的元组(如果没有成功匹配,则返回一个空的元组)

###match(): 匹配字符串

 #####match#####

 import re

 m = re.match('foo','foo')  #模式匹配字符串
if m is not None: #如果不为None,则成功显示foo
print(m.group())
print(m) #返回一个匹配对象的实例。 #虽然定义字符串长,但是匹配是从开头匹配,成功则返回。否则报错。
m1 = re.match('foo','food on the table').group()
print(m1) #输出:
foo
<_sre.SRE_Match object; span=(0, 3), match='foo'> foo

  

###search() : 在一个字符串中查找一个模式

 #####search#####

 m = re.match('foo','seafood').group()#匹配不到会抛出异常
print(m) m = re.search('foo', 'seafood').group()#可以匹配任意位置
print(m) 输出:
AttributeError: 'NoneType' object has no attribute 'group' foo

###findall():找到每个出现的匹配部分

 #####findall#####

 print(re.findall('car','car'))
print(re.findall('car','mycar'))
print(re.findall('car','carry the barcardi to the car')) #输出: ['car']
['car']
['car', 'car', 'car']

注意 :

   findall()与search()相同的是二者都可在任意位置执行字符串搜索,findall()与search(),match()不同之处,findall()总返回一个列表,没有匹配则返回空列表,匹配到,返回所有匹配部分(从左到右)。

###sub()[subn()]: 进行搜索和替换

 #####sub,subn#####

 print(re.sub('hongfei','zhaohongfei', 'My name is hongfei'))
#匹配到hongfei并替换为zhaohongfei print(re.subn('hongfei','zhaohongfei', 'My name is hongfei'))
#与sub相同,但是返回一个元组,并记录匹配次数 print(re.sub('[abc]','ABC','gtdacf'))#多个元素匹配 print(re.subn('[abc]','ABC','gtdacf')) #输出: My name is zhaohongfei ('My name is zhaohongfei', 1) gtdABCABCf
('gtdABCABCf', 2)

###split(): 分割

 #####split()#####

 print(re.split(':','zhao:hong:fei')) #以分号分割字符串
print(re.split(':','zhao:hongfei')) #输出: ['zhao', 'hong', 'fei']
['zhao', 'hongfei']

###group(), groups()

 #####group, groups#####

 import re

 ###group
a = "123abc456"
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0)) #123abc456,返回整体
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1)) #
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2)) #abc
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3)) # ###gorups #都是返回整体
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(0))
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(1))
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(2))
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).groups(3)) #输出: 123abc456
123
abc
456 ('', 'abc', '') #由此可以看到groups为返回匹配的整体
('', 'abc', '')
('', 'abc', '')
('', 'abc', '')

1. 正则表达式中的三组括号把匹配结果分成三组

  • group() 同group(0)就是匹配正则表达式整体结果
  • group(1) 列出第一个括号匹配部分,group(2) 列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。

2. 没有匹配成功的,re.search()返回None

3. groups为返回匹配到的整体的一个元组。

以上为所学内容总结,后续会继续完善,谢谢!