day8.python文件操作

时间:2023-01-12 18:05:50

打开和关闭文件

open函数

用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。

file = open(file_name [, access_mode][, buffering])

不同模式打开文件的列表:

t:     文本模式(默认)
r: 以只读模式打开文件,指针将放在文件开头
r+: 打开一个文件用来读写,指针在开头
rb: 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
rb+   以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w:   打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
w+:   打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb:   以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
wb+: 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a:   打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+:   打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab:   以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab+: 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

1.只读操作:(r,rb)

对于r:需要注意encoding表示编码集。根据文件的实际保存编码进行获取数据,对于我们而言,更多的是utf-8

r = open('文件测试',mode = 'r',encoding='utf-8')
content = f.read()
print(content)
f.close()

对于rb: 读取出来的数据是Bytes类型,在rb模式下,不能选择encoding字符集。在读取非文本文件的时候。比如读取MP3、图像、视频等信息的时候就需要用到rb。因为这种数据是没办法直接显示出来的,在后面我们文件上传下载的时候还会用到。还有我们看的直播。实际上都是这种数据。

rb = open('文件测试',mode='rb')
content = rb.read()
print(content )
rb.close() b'\xe8\xa9\xb9\xe5\xa7\x86\xe6\x96\xaf\xef\xbc\x8c\xe5\x93\x88\xe7\x99\xbb\xef\xbc\x8c\xe4\xbf\x9d\xe7\xbd\x97'

2.写模式 (w,wb)

若文件不存在则创建文件,若存在则会覆盖文件,慎用。

w = open('文件操作',mode='w',encoding='utf-8')
w.write('测试一下')
w.close()

写模式下读文件

w = open('文件操作',mode='w',encoding='utf-8')
w.write('测试一下')
count = w.read()
print(count)
w.close()
io.UnsupportedOperation: not readable

二进制写:wb模式下以二进制打开一个文件用于写,不需要指定编码方式。在写入文件的时候需要指定编码方式,否则会报错

w = open('文件操作',mode='wb')
w.write('测试一下下'.encode('utf-8'))
w.close()

3.追加 (a,ab)

追加模式下,文件会追加在文件末尾。

a = open('文件测试',mode='a',encoding='utf-8')
a.write('hello,world')
a.close() # ab二进制追加
ab = open('文件测试',mode='ab')
ab.write('梦三国'.encode('utf-8'))
ab.close()

4.读写模式(r+,r+b)

对于读写模式,必须是先读。因为默认光标是在开头的,准备读取的。当读完了之后再进行写入,我们以后使用频率最高的模式就是r+

r = open('文件操作',mode='r+',encoding='utf-8')
count = r.read()
print(count)
r.write('NBA')
r.flush() #刷新缓冲区
r.close()

错误操作:

若我们先写后读的话,写进去的内容会将文件里面的前N个字符占用取代

r = open('文件操作',mode='r+',encoding='utf-8')
r.write('NBA')
count=r.read()
print(count)
r.close()
NBAlo,world

5.写读模式(w+,w+b)

写读模式会将文件内容清空,再读取。但是读取到的内容为空,说明指针到了最后

r = open('文件操作',mode='w+',encoding='utf-8')
r.write('这是一个安静的晚上')
print(r.read())
r.close() #指针验证
r = open('文件操作',mode='w+',encoding='utf-8')
r.write('这是一个安静的晚上')
r.seek(0)
print(r.read())
r.close()
这是一个安静的晚上

6.追加读(a+)

f = open('log',mode='a+',encoding='utf-8')
f.write('佳琪')
f.seek(0)
print(f.read())
f.close()

7.补充内容

read()  将文件全部读出来,容易引起内存崩塌

1.read (n)

在 r 模式下,读取前3个字符,无论中文英文都一样。如果再次读取,那么会在当前位置继续去读而不是从头读,如果使用的是rb模式,则读取出来的是n个字节。

file = open('文件操作',mode='r',encoding='utf-8' )
count = file.read(3)
print(count)
file.close()
abc(爱死你)
file = open('文件操作',mode='rb' )
count = file.read(3)
print(count)
file.close()
b'\xe7\x88\xb1'

file = open('文件操作',mode='r' ,encoding='utf-8' )
count1 = file.read(3)
count2 = file.read(3)
print(count1)
print(count2)
file.close()

爱是你
  abc

2.readline()

一次读取一行数据,注意: readline()结尾,注意每次读取出来的数据都会有一个\n。所以,需要我们使用strip()方法来去掉\n或者空格。

f = open("2018-11-28/heart",mode="r",encoding="utf-8")
content1 = f.readline()
content2 = f.readline()
print(content1)
print(content2) 爱我记得走心 可乐记得加冰

3.readlines

将每一行形成一个元素,放到一个列表中,将所有的内容都读取出来,所以也是,容易出现内存崩溃的问题,不推荐使用。

f = open("2018-11-28/heart",mode="r",encoding="utf-8")
lst = f.readlines()
print(lst)
for line in lst:
print(line.strip()) ['爱我记得走心\n', '可乐记得加冰\n']
爱我记得走心
可乐记得加冰

4.循环读取

这种方式是最好的,每次读取一行内容,不会产生内存溢出的问题

f = open("2018-11-28/heart",mode="r",encoding="utf-8")
for i in f:
print(i.strip())

***注意: 读取完的文件句柄一定要关闭f.close()

5.seek(n)

光标移动到n位置,注意,移动的单位是byte,所以如果是UTF-8的中文部分要是3的倍数。
通常我们使用seek都是移动到开头或者结尾

移动到开头: seek(0)
移动到结尾: seek(0,2)
seek的第二个参数表示的是从哪个位置进行偏移,默认是0,表示开头,1表示当前位置,2表示结尾。

file = open('文件操作',mode='r+' ,encoding='utf-8' )

file.seek(0) #光标移动到开头
content = file.read() # 此时读完以后光标在结尾
print(content ) file.seek(0) # 光标移动到开头
file.seek(0,2) # 光标移动到结尾
content2 = file.read() # 读出来是空
print(content2 ) file.seek(0)
file.write('测试') # 光标移动到开头,写入‘测试’ 占用前两个字符 file.flush()
file.close()

6.tell () 光标位置

file = open('文件操作',mode='r+' ,encoding='utf-8' )

file.seek(0)
print(file.tell()) content = file.read()
print(file.tell())
print(content ) file.flush()
file.close() 0
17
一二三四五

8.修改文件内容

思路:python文件操作不可直接对文件进行操作,逐行读取修改,并写入新文件。删除旧文件,重命名新文件

with open('小护士班主任',mode= 'r',encoding= 'utf-8') as f1,open('小护士班主任.bak',mode='w',encoding= 'utf-8') as f2:
for line in f1:
if '星儿' in line:
line = line.replace('星儿','阿娇')
f2.write(line) import os
os.remove('小护士班主任')
os.rename('小护士班主任.bak','小护士班主任')