打开和关闭文件
open函数
用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。
file = open(file_name [, access_mode][, buffering])
不同模式打开文件的列表:
t: 文本模式(默认)
r: 以只读模式打开文件,指针将放在文件开头
r+: 打开一个文件用来读写,指针在开头
rb: 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w: 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
w+: 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb: 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
wb+: 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a: 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+: 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab: 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab+: 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。
1.只读操作:(r,rb)
对于r:需要注意encoding表示编码集。根据文件的实际保存编码进行获取数据,对于我们而言,更多的是utf-8
r = open('文件测试',mode = 'r',encoding='utf-8')
content = f.read()
print(content)
f.close()
对于rb: 读取出来的数据是Bytes类型,在rb模式下,不能选择encoding字符集。在读取非文本文件的时候。比如读取MP3、图像、视频等信息的时候就需要用到rb。因为这种数据是没办法直接显示出来的,在后面我们文件上传下载的时候还会用到。还有我们看的直播。实际上都是这种数据。
rb = open('文件测试',mode='rb')
content = rb.read()
print(content )
rb.close() b'\xe8\xa9\xb9\xe5\xa7\x86\xe6\x96\xaf\xef\xbc\x8c\xe5\x93\x88\xe7\x99\xbb\xef\xbc\x8c\xe4\xbf\x9d\xe7\xbd\x97'
2.写模式 (w,wb)
若文件不存在则创建文件,若存在则会覆盖文件,慎用。
w = open('文件操作',mode='w',encoding='utf-8')
w.write('测试一下')
w.close()
写模式下读文件
w = open('文件操作',mode='w',encoding='utf-8')
w.write('测试一下')
count = w.read()
print(count)
w.close()
io.UnsupportedOperation: not readable
二进制写:wb模式下以二进制打开一个文件用于写,不需要指定编码方式。在写入文件的时候需要指定编码方式,否则会报错
w = open('文件操作',mode='wb')
w.write('测试一下下'.encode('utf-8'))
w.close()
3.追加 (a,ab)
追加模式下,文件会追加在文件末尾。
a = open('文件测试',mode='a',encoding='utf-8')
a.write('hello,world')
a.close() # ab二进制追加
ab = open('文件测试',mode='ab')
ab.write('梦三国'.encode('utf-8'))
ab.close()
4.读写模式(r+,r+b)
对于读写模式,必须是先读。因为默认光标是在开头的,准备读取的。当读完了之后再进行写入,我们以后使用频率最高的模式就是r+
r = open('文件操作',mode='r+',encoding='utf-8')
count = r.read()
print(count)
r.write('NBA')
r.flush() #刷新缓冲区
r.close()
错误操作:
若我们先写后读的话,写进去的内容会将文件里面的前N个字符占用取代
r = open('文件操作',mode='r+',encoding='utf-8')
r.write('NBA')
count=r.read()
print(count)
r.close()
NBAlo,world
5.写读模式(w+,w+b)
写读模式会将文件内容清空,再读取。但是读取到的内容为空,说明指针到了最后
r = open('文件操作',mode='w+',encoding='utf-8')
r.write('这是一个安静的晚上')
print(r.read())
r.close() #指针验证
r = open('文件操作',mode='w+',encoding='utf-8')
r.write('这是一个安静的晚上')
r.seek(0)
print(r.read())
r.close()
这是一个安静的晚上
6.追加读(a+)
f = open('log',mode='a+',encoding='utf-8')
f.write('佳琪')
f.seek(0)
print(f.read())
f.close()
7.补充内容
read() 将文件全部读出来,容易引起内存崩塌
1.read (n)
在 r 模式下,读取前3个字符,无论中文英文都一样。如果再次读取,那么会在当前位置继续去读而不是从头读,如果使用的是rb模式,则读取出来的是n个字节。
file = open('文件操作',mode='r',encoding='utf-8' )
count = file.read(3)
print(count)
file.close()
abc(爱死你)
file = open('文件操作',mode='rb' )
count = file.read(3)
print(count)
file.close()
b'\xe7\x88\xb1'
file = open('文件操作',mode='r' ,encoding='utf-8' )
count1 = file.read(3)
count2 = file.read(3)
print(count1)
print(count2)
file.close()
爱是你
abc
2.readline()
一次读取一行数据,注意: readline()结尾,注意每次读取出来的数据都会有一个\n。所以,需要我们使用strip()方法来去掉\n或者空格。
f = open("2018-11-28/heart",mode="r",encoding="utf-8")
content1 = f.readline()
content2 = f.readline()
print(content1)
print(content2) 爱我记得走心 可乐记得加冰
3.readlines
将每一行形成一个元素,放到一个列表中,将所有的内容都读取出来,所以也是,容易出现内存崩溃的问题,不推荐使用。
f = open("2018-11-28/heart",mode="r",encoding="utf-8")
lst = f.readlines()
print(lst)
for line in lst:
print(line.strip()) ['爱我记得走心\n', '可乐记得加冰\n']
爱我记得走心
可乐记得加冰
4.循环读取
这种方式是最好的,每次读取一行内容,不会产生内存溢出的问题
f = open("2018-11-28/heart",mode="r",encoding="utf-8")
for i in f:
print(i.strip())
***注意: 读取完的文件句柄一定要关闭f.close()
5.seek(n)
光标移动到n位置,注意,移动的单位是byte,所以如果是UTF-8的中文部分要是3的倍数。
通常我们使用seek都是移动到开头或者结尾
移动到开头: seek(0)
移动到结尾: seek(0,2)
seek的第二个参数表示的是从哪个位置进行偏移,默认是0,表示开头,1表示当前位置,2表示结尾。
file = open('文件操作',mode='r+' ,encoding='utf-8' ) file.seek(0) #光标移动到开头
content = file.read() # 此时读完以后光标在结尾
print(content ) file.seek(0) # 光标移动到开头
file.seek(0,2) # 光标移动到结尾
content2 = file.read() # 读出来是空
print(content2 ) file.seek(0)
file.write('测试') # 光标移动到开头,写入‘测试’ 占用前两个字符 file.flush()
file.close()
6.tell () 光标位置
file = open('文件操作',mode='r+' ,encoding='utf-8' ) file.seek(0)
print(file.tell()) content = file.read()
print(file.tell())
print(content ) file.flush()
file.close() 0
17
一二三四五
8.修改文件内容
思路:python文件操作不可直接对文件进行操作,逐行读取修改,并写入新文件。删除旧文件,重命名新文件
with open('小护士班主任',mode= 'r',encoding= 'utf-8') as f1,open('小护士班主任.bak',mode='w',encoding= 'utf-8') as f2:
for line in f1:
if '星儿' in line:
line = line.replace('星儿','阿娇')
f2.write(line) import os
os.remove('小护士班主任')
os.rename('小护士班主任.bak','小护士班主任')