Python中文件路径名的操作

时间:2021-09-14 03:14:13

1 文件路径名操作

  对于文件路径名的操作在编程中是必不可少的,比如说,有时候要列举一个路径下的文件,那么首先就要获取一个路径,再就是路径名的一个拼接问题,通过字符串的拼接就可以得到一个路径名。Python中3.4版本前使用os.path模块中的函数来操作路径名;3.4版本开始提供pathlib模块,使用Path对象来对目录和文件进行操作。

2 os.path模块

 from os import path

 p = path.join('/etc', 'sysconfig', 'network')    # 根据不同的系统,将每个字符串组合成路径形式
print(type(p), p)
print(path.exists(p)) # 判断路径在当前系统中是否存在
print(path.split(p)) # (head, tail)将路径中的最后一个目录或者文件与前面的路径分开
print(path.abspath('.')) # 返回当前工作路径,'.'代表当前路径
p = path.join('o:/', p, 'test.txt')
print(path.dirname(p)) # 取目录名
print(path.basename(p)) # 取基名
print(path.splitdrive(p)) # 将盘符名和文件路径名分开(对于windows有盘符之分,在Linux中没有盘符) p1 = path.abspath(__file__) # 取当前文件所在的路径
print(p1, path.basename(p1))
while p1 != path.dirname(p1): # 每次取上级目录中的基名
p1 = path.dirname(p1)
print(p1, path.basename(p1))

3 pathlib模块

3.1 目录操作

3.1.1 路径拼接和分解

  • 操作符"/"对路径拼接

  “/”操作符可以对两个Path对象进行拼接、字符串和Path对象或者Path对象和字符串进行拼接

  • parts属性

  parts属性,可以返回路径中的每一个部分

  • joinpath

  joinpath(*other)连接多个字符串到Path对象中

 from pathlib import Path

 p = Path()    # 返回当前目录
p = Path('a', 'b', 'c/d') # 当前目录下的a/b/c/d
p = Path('/etc') # 返回根下的etc目录 p = Path()
p = p / 'a'
p1 = 'b' / p
p2 = Path('c')
p3 = p2 / p1
print(p3.parts)
p3.joinpath('etc', 'init.d', Path('httpd'))

3.1.2 获取路径

  • str获取路径字符串
  • bytes获取路径字符串的bytes
 p = Path('/etc')
print(str(p), bytes(p))

3.1.3 获取路径中的父目录

  • parent属性返回目录的逻辑父目录
  • parents属性返回父目录序列,索引0是直接的父目录
 p = Path('/a/b/c/d')
print(p.parent.parent) # 返回当前路径的父目录的父目录即/a/b
for x in p.parents: # 将当前路径的每一级的父目录序列化
print(x)

3.1.4 其他属性及方法

属性 含义
name 目录的最后一个部分
stem  目录最后一个部分,不包含后缀
suffix 目录中最后一个部分的扩展名
suffixes 返回多个扩展名列表

  和以上四个属性相关的方法:

  •   with_suffix(suffix)补充扩展名到路径尾部,返回新的路径,扩展名存在则修改之
  •   with_name(name)替换目录最后一个部分并返回一个新的路径
 p = Path('/viktor/mysqlinstall/mysql.tar.gz')
print(p.name) # mysql.tar.gz
print(p.suffix) # .gz
print(p.suffixes) # ['.tar', '.gz']
print(p.stem) # mysql.tar
print(p.with_name('mysql-5.tgz')) # /viktor/mysqlinstall/mysql-5.tgz
p = Path('README')
print(p.with_suffix('.txt')) # README.txt

  和文件类型相关的方法:

方法 功能
is_dir() 是否是目录,目录存在返回True
is_file() 是否是普通文件,文件存在返回True
is_symlink() 是否软链接
is_socket() 是否是socket文件
is_block_device() 是否是块设备
is_char_device() 是否是字符设备
is_absolute() 是否是绝对路径

  其他几种方法:

方法 功能
cwd() 返回当前工作目录
home() 返回当前家目录
resolve() 

返回一个新的路径,这个新路径就是当前Path对象的绝对路径。

如果是软链接则直接被解析

absolute() 也可以获取绝对路径,但是推荐使用resolve()
exists() 判断目录或文件是否存在
rmdir() 删除空目录。没有提供判断目录为空的方法

touch(mode=0o666,

exist_ok=True)

创建一个文件
as_url() 将路径返回成URL,例如'file:///etc/passwd'

mkdir(mode=0o777,

parents=False,

exists_ok=False)

parents参数是判断是否创建父目录,True等同于mkdir -p;

False时,父目录不存在,则抛出FileNotFoundError

exist_ok参数,在3.5版本加入。False时,路径存在,

抛出FileExistsError;True时,FileExistsError被忽略

iterdir() 迭代当前目录
 p = Path()
p /= 'a/b/c/d'
p.exists() # True # 创建目录
p.mkdir() # 如果p对象的路径存在抛出FileExistsError,否则抛出FileNotFoundError
p.mkdir(parents=True)
p.exists() # True
p.mkdir(parents=Ture) # 抛出FileExistsError
p.mkdir(parents=True, exist_ok=True) # 忽略FileExistsError
p /= 'readme.txt'
p.parent.rmdir() # 删除readme.txt的父目录,此时真实目录中已经不存在d目录
p.parent.exists() # False 'a/b/c'
p.mkdir() # FileNotFoundError
p.mkdir(parent=True) # 成功

  实现遍历,并判断文件类型,如果是目录是否可以判断其是否为空的代码:

 for x in p.parents[len(p.parents)-1].iterdir():
print(x, end='\t')
if x.is_dir():
flag = False
for _ in x.iterdir():
flag = True
break
print('dir','Not Empty' if flag else 'Empty', sep='\t')
elif x.is_file():
print('file')
else:
print('other file')

3.2 文件操作

  pathlib中的Path还提供open(mode='r', buffering=-1, encoding=None, errors=None, newline=None)方法打开文件,其使用方法类似内建函数open,返回一个文件对象。Ptyhon3.5后pathlib模块新增加了一些方法,如下所示:

方法 功能
read_bytes() 以‘rb’读取路径对应文件,并返回二进制流

read_text(encoding=None,

errors=None)

以'rt'方式读取路径对应文件,返回文本
Path.write_bytes(data) 以'wb'方式写入数据到路径对应文件

write_text(data, encoding=None,

errors=None)

以'wt'方式写入字符串到路径对应文件
 p = Path("my_binary_file")
p.write_bytes(b'Binary file contents') # 以'wb'形式向p路径对象写入数据
p.read_bytes() p = Path("my_text_file")
p.write_text('Text file contents') # 以'wt'形式向p路径对象写入数据
p.read_text() with p.open() as f:
print(f.read(5))