Python 搜索文件,文件过滤,pathlib模块

时间:2023-03-09 17:08:06
Python 搜索文件,文件过滤,pathlib模块

1,搜索文件,文件过滤

这里使用:pathlib 模块的  Path.glob(pattern)  方法,该方法可以用来过滤目标文件,以迭代器的形式返回搜索结果。

pattern: 通配符:
"*.py":搜索指定目录下所有的py后缀文件,只搜索当前目录,不搜索子目录。
"**/*.py":搜索指定目录下所有的py后缀文件,包括子目录。"**" 模式表示 “此目录以及所有子目录,递归”。换句话说,它启用递归通配:

  1. 文件名可以使用以下符号组合进行模式匹配:
  2. " * " 匹配0个或多个字符
  3. " ? " 仅匹配一个字符
  4. " [] " 匹配指定范围内的字符,如[0-9]匹配数字

2,用法:

Python 搜索文件,文件过滤,pathlib模块

1,只遍历当前目录

  1. import pathlib
  2. # 构建一个pathlib.Path()对象
  3. # 指定一个目录起始点:"F:/path_test"
  4. p = pathlib.Path("F:/path_test")
  5. # 遍历 F:/path_test目录下,所有的 py 文件
  6. # 只遍历当前目录
  7. ret = p.glob("*.py")
  8. for item in ret:
  9. print(item)
  10. """ 运行结果
  11. F:\path_test\01.py
  12. F:\path_test\02.py
  13. """

2,递归遍历

  1. # ......
  2. # 遍历 F:/path_test目录及子目录下 所有的 py 文件
  3. # 递归遍历所有子目录
  4. ret = p.glob("**/*.py")
  5. for item in ret:
  6. print(item)
  7. """ 运行结果
  8. F:\path_test\01.py
  9. F:\path_test\02.py
  10. F:\path_test\src\11.py
  11. F:\path_test\src\22.py
  12. """

3,Path.rglob()  递归遍历

  1. # ......
  2. # 遍历 F:/path_test目录及子目录下 所有的 py 文件
  3. # 递归遍历所有子目录
  4. # 这就像调用 Path.glob()时,通配符 pattern 前面添加了 "**/" 一样
  5. ret = p.rglob("*.py")
  6. for item in ret:
  7. print(item)
  8. """ 运行结果
  9. F:\path_test\01.py
  10. F:\path_test\02.py
  11. F:\path_test\src\11.py
  12. F:\path_test\src\22.py
  13. """

缺点:当目录树较大时,Path.glob() 耗时较长。

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理
想要获取更多Python学习资料可以加
QQ:2955637827私聊
或加Q群630390733
大家一起来学习讨论吧!