Python开发【第五篇】:模块

时间:2023-08-05 17:28:46

递归的案例:阶乘

1*2*3*4*5*6*7…

  1. def func(num):
  2.     if num == 1:
  3.         return 1
  4.     return num * func(num - 1)
  5. ret = func(7)
  6. print(ret)

反射

  1. def f1():
  2.    print('f1')

f1:函数名

'f1':字符串

commons:

  1. def login():
  2.     print('登录页面')
  3. def logout():
  4.     print('退出页面')
  5. def home():
  6.     print('主页面')

index:

  1. import commons
  2. def run():
  3.     inp = input('请输入要访问的url:')
  4.     if inp == 'login':
  5.         commons.login()
  6.     elif inp == 'logout':
  7.         commons.logout()
  8.     elif inp == 'home':
  9.         commons.home()
  10.     else:
  11.         print('404')
  12. if __name__ == '__main__':
  13.     run()

用反射进行优化,利用字符串的形式去对象(模块)中操作(寻找)成员。

index:

  1. import commons
  2. def run():
  3.     inp = input('请输入要访问的url:')
  4.     #反射:利用字符串的形式去对象(模块)中操作(寻找/检查/删除/设置)成员
  5.     #hasattr查看inp是否存在(返回True or False)
  6.     if hasattr(commons,inp):
  7.         func = getattr(commons,inp)
  8.         func()
  9.     else:
  10.         print('404')
  11. if __name__ == '__main__':
  12.     run()

hasattr():寻找

getattr():检查

delattr():删除

setattr():设置

进一步优化,字符串导入。

index:

  1. def run():
  2.     inp = input('请输入要访问的url:')
  3.     m,f = inp.split('/')
  4.     obj = __import__(m)
  5.     if hasattr(obj,f):
  6.         func = getattr(obj,f)
  7.         func()
  8.     else:
  9.         print('404')
  10. if __name__ == '__main__':
  11.     run()

补充,当需要导入文件夹下面的:

  1. obj = __import__('lib.account')
  2. print(obj)
  3. 输出:<module 'lib' from 'D:\\work_software\\PycharmProjects\\oldboy_python\\day6\\lib\\__init__.py'>
  4. obj = __import__('lib.account',fromlist=True)
  5. print(obj)
  6. 输出:<module 'lib.account' from 'D:\\work_software\\PycharmProjects\\oldboy_python\\day6\\lib\\account.py'>

web框架的路由系统。

特殊变量__file__

  1. import os
  2. print(__file__)
  3. #abspath()获取绝对路径
  4. print(os.path.abspath(__file__))
  5. #获取上级目录dirname()
  6. ret = os.path.dirname(os.path.abspath(__file__))
  7. ret_1 = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
  8. print(ret)
  9. print(ret_1)
  10. 输出:
  11. D:/work_software/PycharmProjects/oldboy_python/day6/bin/admin.py
  12. D:\work_software\PycharmProjects\oldboy_python\day6\bin\admin.py
  13. D:\work_software\PycharmProjects\oldboy_python\day6\bin
  14. D:\work_software\PycharmProjects\oldboy_python\day6

特殊变量__name__

  1. #只有执行当前文件的时候,当前文件的特殊变量__name__ == '__main__'
  2. def run():
  3.     print('rum')
  4. if __name__ == "__main__":
  5.     run()

sys模块

用于提供python解释器相关的操作。

sys.argv:命令行参数list,第一个元素是程序本身路径

sys.exit(n):退出程序,正常退出时exit(0)

sys.version:获取python解释程序的版本信息

sys.maxint:最大的int值

sys.path:返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值

sys.platform:返回操作系统平台名称

sys.stdin:输入相关

sys.stdout:输出相关

sys.stderror:错误相关

进度百分比:

  1. import time
  2. import sys
  3. def view_bar(num,total):
  4.     rate = float(num)/float(total)
  5.     rate_num = int(rate * 100)
  6.     #数字进度显示
  7.     #\r回到当前行的首位置
  8.     r = '\r%d%%'%(rate_num)
  9.     #输出不换行
  10.     sys.stdout.write(r)
  11.     #进度条显示
  12.     """
  13.     r1 = '\r%s>%d%%'%("="*num,rate_num)
  14.     sys.stdout.write(r1)
  15.     """
  16.     sys.stdout.flush()
  17. if __name__ == '__main__':
  18.     for i in range(0,101):
  19.         time.sleep(0.1)
  20.         view_bar(i,100)

os模块

用于提供系统级别的操作。

os.getcwd():获取当前工作目录,即当前python脚本工作的目录路径。

os.chdir("dirname"):改变当前脚本工作目录,相当于shell下cd。

os.curdir:返回当前目录('.')。

os.pardir:获取当前目录的父目录字符串名('..')。

os.makedirs('dir1/dir2'):可生成多层递归目录。

os.removedirs('dirname1'):若目录为空,则删除,并递归到上一级目录,若也为空,则删除,依次类推。

os.mkdir('dirname'):生成单级目录,相当于shell中mkdir、dirname。

os.rmdir('dirname'):删除单级目录,若目录不为空则无法删除,报错,相当于shell中rmdir dirname。

os.listdir('dirname'):列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印。

os.remove():删除一个文件。

os.rename("oldname","newname"):重命名文件/目录

os.stat('path/filename'):获取文件/目录信息。

os.sep:操作系统特定的路径分隔符,win下为"\\",linux下为"/"。

os.linesep:当前平台使用的行终止符,win下为"\t\n",linux下为"\n"。

os.pathsep:用于分割文件路径的字符串";"。

os.name:字符串指示当前使用平台,win下为"nt",linux下为"posix"。

os.system("bash command"):运行shell命令,直接显示。

os.environ:获取系统环境变量。

os.path.abspath(path):返回path规范化的绝对路径。

os.path.split(path):将path分割成目录和文件名二元组返回。

os.path.dirname(path):返回path的目录,其实就是os.path.split(path)的第一个元素。

os.path.basename(path):返回path最后的文件名,如果path以/或\结尾,那么就返回空值。即os.path.split(path)的第二个元素。

os.path.exists(path):如果path存在,返回True,如果path不存在,返回False。

os.path.isabs(path):如果path是绝对路径,返回True。

os.path.isfile(path):如果path是一个存在的文件,返回True,否则返回False。

os.path.isdir(path):如果path是一个存在的目录,返回True,否则返回False。

os.path.join(path1[,path2[,…]]):将多个路径组合后返回,第一个绝对路径之前的参数将被忽略。

os.path.getatime(path):返回path所指向的文件或者目录的最后获取时间。

os.path.getmtime(path):返回path所指向的文件或者目录的最后修改时间。

hashlib

用于加密相关的操作,代替了md5模块和sha模块,主要提供SHA1,SHA224,SHA256,SHA512,MD5算法。

MD5加密:

  1. import hashlib
  2. #添加自定义key再来做加密
  3. obj = hashlib.md5(bytes('shisjajlj131424rdt5t6577ueuewmz',encoding='utf-8'))
  4. obj.update(bytes('123',encoding='utf-8'))
  5. result = obj.hexdigest()
  6. print(result)

正则表达式

字符匹配:普通字符、元字符。

普通字符匹配

  1. import re
  2. ret = re.findall('alex','adasjkalex78272hshdsjhds')
  3. print(ret)
  4. 输出:['alex']

元字符匹配

.:除换行符以外的任何一个字符

  1. import re
  2. ret = re.findall('al.x','uiiu9alaxuialbx798alcx21oalaaxiwq2al\nxjk')
  3. print(ret)
  4. 输出:['alax', 'albx', 'alcx']

^:以什么开头

  1. import re
  2. ret = re.findall('^al.x','al@xjkasjalexk')
  3. print(ret)
  4. 输出:['al@x']

$:以什么结尾

  1. import re
  2. ret = re.findall('al.x$','al@xhhalexuieuial#x')
  3. print(ret)
  4. 输出:['al#x']

*:重复*前面的字符0次到n次

  1. import re
  2. ret = re.findall('al.*x','yiuial3278hcxuxewualeexo')
  3. print(ret)
  4. 输出:['al3278hcxuxewualeex']

+:重复+前面一个字符的1次到n次

?:重复?前面一个字符的0次或1次

{}:指定重复的次数,{1,5}重复1次到5次,{5}重复5次,{,5}重复0次到5次,{5,}重复5次到n次。

[]:或,[a-z]匹配a到z的任何一个,[ab]匹配a或b。

[]里面的特殊含义

-:表示范围,例如[0-9]表示0到9。

^:表示非、排除,例如[^d]表示排除d;

\:反斜杠后边跟元字符去除特殊功能;反斜杠后边跟普通字符实现特殊功能;引用序号对应的字组所匹配的字符串,例如re.search(r"(alex)(eric)com\2","alexericcomeric")。

\d:匹配任何十进制数,相当于[0-9]。

\D:匹配任何非数字字符,相当于[^0-9]。

\s:匹配任何空白字符,相当于[ \t\n\r\f\v]。

\S:匹配任何非空白字符,相当于[^ \t\n\r\f\v]。

\w:匹配任何字母数字字符,相当于[a-zA-Z0-9_]。

\W:匹配任何非字母数字字符,相当于[^a-zA-Z0-9_]。

\b:匹配一个字符串的边界,也就是指单词和空格间的位置。字符串是指连续的字母、数字和下划线组成的。注意,\b的定义是\w和\W的交界。

  1. import re
  2. ret = re.findall(r'I\b','I am aaIbbb')
  3. print(ret)
  4. 输出:['I']

零宽界定符(zero-width assertions)只用以匹配字符串的头部和尾部。尾部用空白符或非字母数字符来标识。

():指定匹配的组。

函数

match

re.match(pattern,string,flags=0),match只匹配起始位置。

flags编译标志位,用于修改正则表达式的匹配方式,如是否区分大小写,多行匹配等。

  1. import re
  2. ret = re.match('com','comwww.runcomoob')
  3. print(ret)
  4. ret = re.match('com','comwww.runcomoob').group()
  5. print(ret)
  6. ret = re.match('com','comwww.runcomoob').span()
  7. print(ret)
  8. 输出:
  9. <_sre.SRE_Match object; span=(0, 3), match='com'>
  10. com
  11. (0, 3)

search

一旦匹配成功,就是一个match object对象。

  1. import re
  2. ret = re.search('\dcom','www.4comrunco.5com')
  3. print(ret)
  4. 输出:<_sre.SRE_Match object; span=(4, 8), match='4com'>

match object对象拥有以下方法:

group()返回被RE匹配的字符串。

group()返回re整体匹配的字符串,可以一次输入多个组号,对应组号匹配的字符串。

1、group()返回re整体匹配的字符串。

2、group(n,m)返回组号为n,m所匹配的字符串,如果组号不存在,则返回indexError异常。

3、groups()返回一个包含正则表达式中所有小组字符串的元组,从1到所含的小组号,通常groups()不需要参数,返回一个元组,元组中的元就是正则表达式中定义的组。

start()返回匹配开始的位置。

end()返回匹配结束的位置。

span()返回一个元组包含匹配(开始,结束)的位置。

findall

re.findall以列表形式返回所有匹配的字符串。

sub

匹配替换。

re.sub(pattern,repl,string,max=0)

  1. import re
  2. ret = re.sub("g.t","have",'I get A,I got B,I gut C')
  3. print(ret)
  4. 输出:I have A,I have B,I have C

设置最大替换次数

  1. import re
  2. ret = re.sub("g.t","have",'I get A,I got B,I gut C',2)
  3. print(ret)
  4. 输出:I have A,I have B,I gut C

subn

  1. import re
  2. ret = re.subn("g.t","have",'I get A,I got B,I gut C')
  3. print(ret)
  4. 输出:('I have A,I have B,I have C', 3)

split

  1. import re
  2. ret = re.split('\d+','0one1two2three3four4')
  3. print(ret)
  4. 输出:['', 'one', 'two', 'three', 'four', '']

compile

re.compile(strPattern[,flag])

这个方法是Pattern类的工厂方法,用于将字符串形式的正则表达式编译为Pattern对象。第二个参数flag是匹配模式,取值可以使用按位或运算符'|',表示同时生效,例如re.I|re.M,可以把经常使用的正则表达式编译成正则表达式对象,这样可以提高一定的效率。

  1. import re
  2. text = "JGood is a handsome boy,he is cool,clever,and so on..."
  3. regex = re.compile(r'\w*oo\w*')
  4. ret = regex.findall(text)
  5. print(ret)
  6. 输出:['JGood', 'cool']

re.I:使匹配对大小写不敏感。

re.L:做本地化识别(locale-aware)匹配。

re.M:多行匹配,影响^和$。

re.S:使"."匹配包括换行在内的所有字符。

re.U:根据Unicode字符集解析字符。这个标识影响\w,\W,\b,\B。

正则分组

在已经匹配到的数据中再提取数据。

match的分组匹配

  1. import re
  2. origin = "has dhjdahk29832"
  3. r = re.match("h\w+",origin)
  4. #获取匹配到的所有结果
  5. print(r.group())
  6. #获取模型中匹配到的分组结果
  7. print(r.groups())
  8. #获取模型中匹配到的分组结果
  9. print(r.groupdict())
  10. 输出:
  11. has
  12. ()
  13. {}
  14. import re
  15. origin = "has dhjdahk29832"
  16. r = re.match("h(\w+)",origin)
  17. #获取匹配到的所有结果
  18. print(r.group())
  19. #获取模型中匹配到的分组结果
  20. print(r.groups())
  21. #获取模型中匹配到的分组结果
  22. print(r.groupdict())
  23. 输出:
  24. has
  25. ('as',)
  26. {}
  27. import re
  28. origin = "has dhjdahk29832"
  29. r = re.match("h(?P<name>\w+)",origin)
  30. #获取匹配到的所有结果
  31. print(r.group())
  32. #获取模型中匹配到的分组结果
  33. print(r.groups())
  34. #获取模型中匹配到的分组结果
  35. print(r.groupdict())
  36. 输出:
  37. has
  38. ('as',)
  39. {'name': 'as'}

findall的分组匹配

  1. import re
  2. origin = "has sajkd hjda hk2983ds wqw2"
  3. r = re.findall("h(\w+)",origin)
  4. print(r)
  5. 输出:['as', 'jda', 'k2983ds']
  6. import re
  7. origin = "hasaabc sajkd hjdaabc hk2983dsaabc wqw2"
  8. r = re.findall("h(\w+)a(ab)c",origin)
  9. print(r)
  10. 输出:[('as', 'ab'), ('jd', 'ab'), ('k2983ds', 'ab')]

 

split的分组匹配

  1. import re
  2. origin = "hello alex bcd alex lgc alex acd 19"
  3. r = re.split("alex",origin,1)
  4. print(r)
  5. 输出:['hello ', ' bcd alex lgc alex acd 19']
  6. import re
  7. origin = "hello alex bcd alex lgc alex acd 19"
  8. #匹配值中()的内容需要输出
  9. r = re.split("(alex)",origin,1)
  10. print(r)
  11. 输出:['hello ', 'alex', ' bcd alex lgc alex acd 19']
  12. import re
  13. origin = "hello alex bcd alex lgc alex acd 19"
  14. r = re.split("a(le)x",origin,1)
  15. print(r)
  16. 输出:['hello ', 'le', ' bcd alex lgc alex acd 19']
  17. import re
  18. origin = "hello alex bcd alex lgc alex acd 19"
  19. r = re.split("(a(le)x)",origin,1)
  20. print(r)
  21. 输出:['hello ', 'alex', 'le', ' bcd alex lgc alex acd 19']
  22. import re
  23. origin = "hello alex bcd alex lgc alex acd 19"
  24. r = re.split("(a(l(e))x)",origin,1)
  25. print(r)
  26. 输出:['hello ', 'alex', 'le', 'e', ' bcd alex lgc alex acd 19']