08_python_文件操作

时间:2022-06-07 23:09:26

一、初始文件操作

  打开⽂件的⽅式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使⽤的是r(只读)模式
 f = open("少妇嫩模.txt",mode="r", encoding="utf-8")  # 注意encoding表示编码集. 根据文件的实际保存编码进行获取数据
文件句柄 文件路径 操作模式 使用编码
f.close() # 打开一个文件后必须将其关闭

二、读

  1、只读( r   r+)
  rb. 读取出来的数据是bytes类型, 在rb模式下.。不能选择encoding字符集, rb的作⽤: 在读取非⽂本⽂件的时候. 比如读取MP3. 图像. 视频等信息的时候就需要⽤到 rb. 因为这种数据是没办法直接显⽰出来的
 f = open("少妇嫩模.txt",mode="rb" )
content = f.read()
print(content)
f.close()
结果:
b'\xe6\xaf\x85\xe5\x93\xa5, \xe5\xa4\xaa\xe7\x99\xbd,
wuse\n\xe5\x91\xb5\xe5\x91\xb5\n\xe6\x97\xa5\xe5\xa4\xa9'
  绝对路径:(1)从磁盘根目录找  (2)网络上的路径
  相对路径:相对于当前你这个程序所在的文件夹   ../  返回上层目录
 
  2、读取文件的方法
    (1)read() 将文件全部读取出来,弊端:占内存,如果文件过大,会导致内存溢出
 f = open("../def/哇擦.txt", mode="r", encoding="utf-8")
content = f.read()
print(content) f.read(3) #表示读取3个字符需要注意的是. 如果再次读取. 那么会在当前位置继续去读而不是从头读, 如果使用的是rb模式. 则读取出来的是n个字节
 (2)readline()
    ⼀次读取⼀⾏数据, 注意: readline()结尾, 注意每次读取出来的数据都会有⼀ 个\n 所以呢. 需要我们使⽤strip()⽅法来去掉\n或者空格
    (3)readlines()
    会把数据全部读出来,同样会导致内存溢出
    (4)for循环迭代文件句柄读取文件(推荐
 f = open("../def/哇擦.txt", mode="r", encoding="utf-8")
for i in f:
print(i, end = ',') # print(self, *args, sep=' ', end='\n', file=None) 可以修改end 把\n换成别的
f.close() # 操作完成必须关闭字典

二、写( w wb)

  注意:写的时候. 如果没有⽂件. 则会创建⽂件, 如果⽂件存在. 则将原件中原来的内容删除, 再 写入新内容
 f = open("娃娃", mode="w", encoding="utf-8")
f.write("狮王")
f.flush() # 刷新. 养成好习惯
f.close() f.write('a')
f.write('b') # 第二次写的时候是不会清空的了,直接追加写

  wb模式下. 可以不指定打开⽂件的编码. 但是在写⽂件的时候必须将字符串转化成utf-8的 bytes数据

 f = open("⼩娃娃", mode="wb")
f.write("⾦⽑狮王".encode("utf-8"))
f.flush()
f.close()

三、追加( a ab)

  在追加模式下,写入的内容会追加到文件末尾
 f = open("⼩娃娃", mode="a", encoding="utf-8")
f.write("麻花藤的最爱")
f.flush()
f.close()

四、读写模式

  对于读写模式. 必须是先读. 因为默认光标是在开头的. 准备读取的. 当读完了之后再进⾏ 写入. 我们以后使⽤频率最⾼的模式就是r+

五、写读模式

  先将所有的内容清空. 然后写入. 最后读取. 但是读取的内容是空的, 不常⽤。a+模式下, 不论先读还是后读. 都是读取不到数据的. 

六、其他操作

  1、seek(n)
  seek(n) 光标移动到n位置, 注意, 移动的单位是byte. 所以如果是UTF-8的中⽂部分要 是3的倍数.
  通常移动光标都是将其移动到开头和结尾  (1) 开头 f.seek(0)   (2) 结尾 f.seek(0, 2) # seek的第⼆个参数表⽰的是从哪个位置进⾏偏移, 默认是0, 表 ⽰开头, 1表⽰当前位置, 2表⽰结尾
 f = open("⼩娃娃", mode="r+", encoding="utf-8")
f.seek(0) # 光标移动到开头
content = f.read() # 读取内容, 此时光标移动到结尾
print(content)
f.seek(0) # 再次将光标移动到开头
f.seek(0, 2) # 将光标移动到结尾
content2 = f.read() # 读取内容. 什么都没有
print(content2)
f.seek(0) # 移动到开头
f.write("张国荣") # 写⼊信息. 此时光标在9 中⽂3 * 3个 = 9
f.flush()
f.close()
  2、tell()
    获取光标位置
  3、truncate() 截断文件
 f = open("娃娃", mode="w", encoding="utf-8")
f.write("哈哈") # 写入两个字符
f.seek(3) # 光标移动到3, 也就是两个字中间
f.truncate() # 删掉光标后面的所有内容
f.close() f = open("娃娃", mode="r+", encoding="utf-8")
content = f.read(3) # 读取12个字符
f.seek(4)
print(f.tell())
f.truncate(12) # 如果给了参数会以参数位置有限光标,参数后面的所有内容全部都删掉
# print(content)
f.flush()
f.close()

七、文件修改

 import os
with open("娃娃", mode="r", encoding="utf-8") as f1,\ # \连接后面的语句
open("娃娃_new", mode="w", encoding="UTF-8") as f2:
for line in f1:
new_line = line.replace("梨", "冰糖葫芦")
f2.write(new_line)
os.remove("娃娃") # 删除源文件
os.rename("娃娃_new", "娃娃") # 重命名新文件

八、网络请求

 import requests  # 导入网络请求包
re = requests.get('http://t2.hddhhn.com/uploads/tu/201610/198/jnrqtcnyywt.jpg')
f2 = open('e:/genren.jpg', mode='wb')
f2.write(re.content)
f2.flush()
f2.close()
print()