本文主要介绍python对文件以及文件夹的操作,主要涉及到文件的创建、读取、文件内容的修改、删除,文件夹的索引、目录的判断等等。此节内容非常重要,是以后编程的基础。python文件夹和文件的操作主要借助于os和shutil模块,它是python内置模块,不需要安装,直接导入即可使用。
import os
path = os.getcwd() # get the current path
print(path)
1. 文件以及目录的操作
1.1 得到当前目录,即返回当前运行文件所在的目录
import os
path = os.getcwd() # get the current path
print(path)
1.2 得到目录下的文件(即返回文件名称,包含文件夹名称,将这些名称组成一个列表)
import os
path = os.getcwd()
files = os.listdir(path)
for file in files:
print(file)
1.3 删除目录(文件)
import os
os.removedirs(r'd:\home')
1.4 判断给出的路径是否是一个目录(文件)
import os
os.path.isdir(r'd:\home')
os.path.isfile(r'd:\home\a.py')
1.5 判断给出的路径是否为绝对路径
import os
os.path.isabs(r'd:\home')
1.6 判断给出的路径是否存在
import os
os.path.exists(r'd:\home')
1.7 将路径分离为文件名和目录名
import os
path, file = os.path.split(r'd:\home\a.py')
1.8 重命名目录或文件
import os
os.rename(a,b)
1.9 创建目录
import os
os.mkdir('test')
os.mkdirs(r'd:\home\a')
1.a 获取目录(文件)属性以及文件大小
import os
os.stat(path) # 获取文件属性
os.path.getsize(path) # 获取文件大小
1.b 与系统有关(linux,Windows,macos),不同的系统的路径连接符不一样,所以直接使用连接符很容易使代码不能在不同的平台上使用,所以要合理的使用os库中的分隔符来代替
import os
os.name # 返回系统名称,对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'
os.linesep # 给出当前平台使用的行终止符
os.path.sep # 路径分隔符,可以跨平台使用
1.c 连接路径,在跨平台使用时比较重要
import os
new_path = os.path.join(old_path,a)
1.d 移动(复制)文件(目录),移动和复制需要使用库shutil
复制文件:
shutil.copyfile("oldfile","newfile") # oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile") # oldfile只能是文件夹,newfile可以是文件,也可以是目标目录
复制文件夹:
shutil.copytree("olddir","newdir") # olddir和newdir都只能是目录,且newdir必须不存在
移动文件(目录)
shutil.move("oldpos","newpos")
删除文件
os.remove("file")
删除目录
os.rmdir("dir")只能删除空目录
shutil.rmtree("dir") 空目录、有内容的目录都可以删
转换目录
os.chdir("path") 换路径
2. 文件的创建与读取
2.1 文件的创建
import os
os.mknod("a.txt") # 创建空文件,文件名称为a.txt
2.2 文件的读取
import os
with open(file_name, 'rb') as file:
a = file.read(20)
2.2.1 文件的打开模式
模式名称 |
模式详解 |
w |
以写方式打开 |
a |
以追加模式打开 (从 EOF 开始, 必要时创建新文件) |
r+ |
以读写模式打开 |
w+ |
以读写模式打开 (参见 w ) |
a+ |
以读写模式打开 (参见 a ) |
rb |
以二进制读模式打开 |
wb |
以二进制写模式打开 (参见 w ) |
ab |
以二进制追加模式打开 (参见 a ) |
rb+ |
以二进制读写模式打开 (参见 r+ ) |
wb+ |
以二进制读写模式打开 (参见 w+ ) |
ab+ |
以二进制读写模式打开 (参见 a+ ) |
2.2.2 文件流的操作方法
操作方法名称 |
方法详解 |
fp.read([size]) |
size为读取的长度,以byte为单位 |
fp.readline([size]) |
读一行,如果定义了size,有可能返回的只是一行的一部分 |
fp.readlines([size]) |
把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。 |
fp.write(str) |
把str写到文件中,write()并不会在str后加上一个换行符 |
fp.writelines(seq) |
把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。 |
fp.close() |
关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueError |
fp.flush() |
把缓冲区的内容写入硬盘 |
fp.fileno() |
返回一个长整型的”文件标签“ |
fp.isatty() |
文件是否是一个终端设备文件(unix系统中的) |
fp.tell() |
返回文件操作标记的当前位置,以文件的开头为原点 |
fp.next() |
返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。 |
fp.seek(offset[,whence]) |
将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。 |
fp.truncate([size]) |
把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。 |