[Python模块学习] glob模块

时间:2022-09-01 21:39:10

glob模块

功能描述:glob模块可以使用Unix shell风格的通配符匹配符合特定格式的文件和文件夹,跟windows的文件搜索功能差不多。glob模块并非调用一个子shell实现搜索功能,而是在内部调用了os.listdir()和fnmatch.fnmatch()。


glob模块共包含以下3个函数:

  1. glob(pathname, recursive=False)
    第一个参数pathname为需要匹配的字符串。(该参数应尽量加上r前缀,以免发生不必要的错误
    第二个参数代表递归调用,与特殊通配符“**”一同使用,默认为False。
    该函数返回一个符合条件的路径的字符串列表,如果使用的是Windows系统,路径上的“\”符号会自动加上转义符号变为“\\”(方便使用)。
    在3.5版本之后,glob函数支持一个特殊的通配符“**”,该通配符可以匹配指定路径里所有文件和目录,包括子目录里的所有文件和目录。相当于递归地调用了这个函数。使用这个通配符必须加上recursive=True参数。
    在有复杂目录结构的情况下使用该通配符可能会导致性能下降,拖累整个程序的运行,需谨慎使用!

  2. iglob(pathname, recursive=False)
    参数与glob()一致。
    返回一个迭代器,该迭代器不会同时保存所有匹配到的路径,遍历该迭代器的结果与使用相同参数调用glob()的返回结果一致。

  3. escape(pathname)
    这个函数是在3.4版本之后才有的,功能是忽略所有通配符。(可以用于测试某文件是否存在
    3.5.1版本该函数不能正常运行,升级到3.5.2之后恢复正常


需要注意的地方:

glob默认不匹配以点符号(.)开始的文件,如果有这类文件,则需要做特殊处理。

假如当前文件夹包含test.txt和.test.txt两个文件。

>>> import glob
>>> glob.glob('*.txt')
['test.txt']
>>> glob.glob('.*.txt')
['.test.txt']

glob模块支持的通配符:

通配符 功能
* 匹配0或多个字符
** 匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增)
? 匹配1个字符,与正则表达式里的?不同
[exp] 匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符
[!exp] 匹配不在指定范围内的字符

总结:虽然glob模块可以很轻松地匹配特定文件和文件夹,但是仅仅支持少量的通配符,没办法像正则表达式一样匹配更复杂的字符串。使用的时候应当认真考虑使用场景,根据需求针对性地选择解决方案。


官方文档地址:
https://docs.python.org/3.5/library/glob.html#module-glob
感谢内容提供者

以上内容遵循BY-NC-SA协议,欢迎转载,转载请注明作者。