通配符是一些特殊符号,主要有星号(*)和问号(?),用来模糊搜索文件,“*”可以匹配任意个数个符号, “?”可以匹配单个字符。
当查找文件夹时,可以使用它来代替一个或多个真正字符;当不知道真正字符或者需要匹配符合一定条件的多个目标文件时,可以使用通配符代替一个或多个真正的字符。
英文 “globbing”意为统配,python在模块glob中定义了glob()函数,实现了对目录内容进行匹配的功能,glob.glob()函数接受通配模式作为输入,并返回所有匹配的文件名和路径名列表,与os.listdir类似。
glob模块中的常用函数:
1
|
glob(pathname, recursive = False )
|
第一个参数pathname为需要匹配的字符串。(该参数应尽量加上r前缀,以免发生不必要的错误)
第二个参数代表递归调用,与特殊通配符“**”一同使用,默认为False。
该函数返回一个符合条件的路径的字符串列表,如果使用的是Windows系统,路径上的“\”符号会自动加上转义符号变为“\\”。
1
|
iglob(pathname, recursive = False )
|
参数与glob()一致。
返回一个迭代器,该迭代器不会同时保存所有匹配到的路径,而是逐个获取匹配的文件路径名,遍历该迭代器的结果与使用相同参数调用glob()的返回结果一致。
glob模块支持的通配符:
通配符 | 功能 |
---|---|
* | 匹配0或多个字符 |
** | 匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增) |
? | 匹配1个字符,与正则表达式里的?不同 |
[exp] | 匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符 |
[!exp] | 匹配不在指定范围内的字符 |
glob.glob函数使用示例
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
import glob
listglob = []
listglob = glob.glob(r "/home/xxx/picture/*.png" )
listglob.sort()
print listglob
print '--------------------'
listglob = glob.glob(r "/home/xxx/picture/0?.png" )
listglob.sort()
print listglob
print '--------------------'
listglob = glob.glob(r "/home/xxx/picture/0[0,1,2].png" )
listglob.sort()
print listglob
print '--------------------'
listglob = glob.glob(r "/home/xxx/picture/0[0-3].png" )
listglob.sort()
print listglob
print '--------------------'
listglob = glob.iglob(r "/home/xxx/picture/0[a-z].png" )
print listglob
for item in listglob:
print item
|
补充:Python glob() 函数 秒懂
Python glob()
glob模块是最简单的模块之一,内容非常少。用它可以查找符合特定规则的文件路径名。
跟使用windows下的文件搜索差不多。查找文件只用到三个匹配符:'*', “?”, “[ ]”。”*”匹配任意0个或多个字符;”?”匹配任意单个字符;”[ ]”匹配指定范围内的字符,如:[0-9]匹配数字。
不区分大小写
'.'开头的不匹配
print(glob.glob(r' . ./*') )
上一级所有目录
1
2
|
>>> print (glob.glob( "../*" ))
[ '..\\Python37-32' , '..\\Python38-32' ]
|
print(glob.glob(r' ./*') )
本级所有目录
1
2
|
>>> print (glob.glob( "./*" ))
[ '.\\DLLs' , '.\\Doc' , '.\\include' , '.\\Lib' , '.\\libs' , '.\\LICENSE.txt' , '.\\NEWS.txt' , '.\\python.exe' , '.\\python3.dll' , '.\\python38.dll' , '.\\pythonw.exe' , '.\\Scripts' , '.\\tcl' , '.\\Tools' , '.\\vcruntime140.dll' ]
|
print(glob.glob(r' ./ * . *') )
本级所有文件
1
2
|
print (glob.glob( "./*.*" ))
[ '.\\LICENSE.txt' , '.\\NEWS.txt' , '.\\python.exe' , '.\\python3.dll' , '.\\python38.dll' , '.\\pythonw.exe' , '.\\vcruntime140.dll' ]
|
print(glob.glob(r' ./ * . *') )
本级所有dll
1
2
|
>>> print (glob.glob( "./*.dll" ))
[ '.\\python3.dll' , '.\\python38.dll' , '.\\vcruntime140.dll' ]
|
print(glob.glob(r' C:/ * ') )
C盘所有目录
1
2
|
>>> print (glob.glob( "C:/*" ))
[ 'C:/$360Section' , 'C:/$Recycle.Bin' , 'C:/360SANDBOX' , 'C:/Boot' , 'C:/bootmgr' .......]
|
print(glob.glob(“C:/[PB][RO]”) )
C盘所有包含pr/po/br/bo的目录
1
2
|
print (glob.glob( "C:/*[PB][RO]*" ))
[ 'C:/360SANDBOX' , 'C:/Boot' , 'C:/bootmgr' , 'C:/BOOTNXT' , 'C:/BOOTSECT.BAK' , 'C:/PO' , 'C:/Program Files' , 'C:/Program Files (x86)' , 'C:/ProgramData' ]
|
print(glob.glob(“C:/p?O”) )
C盘所有包含P_o的目录
1
2
|
>>> print (glob.glob( "C:/*P?O*" ))
[ 'C:/Program Files' , 'C:/Program Files (x86)' , 'C:/ProgramData' ]
|
print(glob.glob(“C://.txt”) )
C盘两级目录所有的txt
1
2
|
>>> print (glob.glob( "C:/*/*.txt" ))
[ 'C:/xiaoyi\\检索式.txt' ]
|
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/dcrmg/article/details/78309469