第九天- 文件操作 r w a 文件复制/修改

文件操作简介：
使用python来读写文件是非常简单的操作.我们使用 open() 函数来打开一个文件,获取到文件句柄.然后
通过文件句柄就可以进行各种各样的操作了.根据打开⽅方式的不同能够执行的操作也会有相应的差异.
打开文件的方式： r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使⽤用的是r(只读)模式

相对路径 绝对路径：
绝对路径：从磁盘根目录开始寻找到文件目录 如：E:\Python_workspace\t\n\王尼玛.txt
相对路径：从文件保存路径寻找，若在同一层文件夹中，则相对路径就是文件名，
若是上一层.则加上 ../  以此类推

只读操作模式(r rb)：

r  打开文件open() 读取第n个字符.read(n)

 # r  打开文件open() 读取第n个字符.read(n)

 f = open("操作文件.txt",mode="r",encoding="utf-8") # f 变量 操控文件的句柄

 # 注意encoding表示编码集.根据文件的实际保存编码(windows默认为gbk)进行获取数据，常用utf-8

 content = f.read(3) # 读取第三个字符

 # content1 = f.read()  # 一次性读取全部字符

 print(content)

 # print(content1)

 f.close()

 # 注意read(n)读取第n个字符，若再次读取时会在 当前位置继续 去读而不是从头去读取

　　 rb 常用于非文本文件在rb模式下.不能选择encoding字符集.

 # rb 常用于非文本文件 在rb模式下.不能选择encoding字符集.

 f = open("../问题1.jpg",mode="rb")

 content = f.read()

 print(content) # 返回字节 b'\xff\xd8\xff\xe0\x00\x10JFIF\x00......'

 f.close()

 # read() 将文件内容全部读取出来 ，缺点：占内存，若文件过大容易导致崩溃

　　readline() 读取一行数据

 f = open("../王尼玛.txt",mode="r",encoding="utf-8")

 s = f.readline() # 读取一行数据

 print(s.strip()) # stirp() 去掉空白 空格 \t \n

 f.close()

　　 readlines()将每一行形成一个元素,放到列表中.所有的内容都读取出来.容易出现内存崩溃的问题.

 lis = f.readlines()  # 一次性全读取出，返回列表

 lis1 = []

 for i in lis:

     lis1.append(i.strip())

 print(lis1)

 # readline() readlines()和read()一样 多次读取时不是从头开始 而是接着上面

　　\n \t 转义字符有固定含义推荐用 r 取消功能

 f = open(r"E:\Python_workspace\t\n\666.txt",mode="r",encoding="utf-8")

 print(f.read())

 f.close()

read() readlines()都不推荐使用甚至是不使用，特别是在生产环境里！！

 # read() readlines()都不推荐使用甚至是不使用，特别是在生产环境里！！

 # 若需要读取 可通过 readline() 一次读取一行  以及循环读取

 # 循环读取

 # # 文件句柄是一个可迭代对象(必须掌握)

 f = open("../王尼玛.txt",mode="r",encoding="utf-8")

 for line in f: # 当成list读取文件内容 一行一行的读取 每次读的内容都交给前面的变量

     print(line.strip())

 f.close()

　　注意读取完文件句柄一定要关闭 f.close()

　　追加(a,ab)

 # 只要是a或者ab,a+ 都是在文件的末尾写入.不论光标在任何位置.

 f = open("../王尼玛.txt",mode="a",encoding="utf-8")

 f.write("这是一只后入的王尼玛！")

 f.flush()

 f.close()

 # ab a+ 模式下一样

# mode:
#   r:只读
#   w:写, 先清空里面的内容. 然后再写入
#   a: 追加写入.


文件操作： w 
　　只写 w 
　　注意.写入时,若没文件.则会创建文件,如果文件存在.则将删除(首次)原内容,再写入新内容

 f = open("哇哈哈.txt",mode="w",encoding="utf-8") # 创建新文件

 f.write("哇哈哈,爽歪歪")

 f.flush()  # 刷新 养成好习惯

 f.write(" 优酸乳，美滋滋啊") # 第二次write不会删除原内容 仅仅写入新内容

 # f.read() # 只写模式 不能读取 报错 not readable

 f.close()  # 关闭句柄

　　只写字节 wb

 # wb模式下.可不指定文件的编码.但在写文件时必须将字符串转化成utf-8的bytes数据

 f = open("小屁孩.txt",mode="wb")

 f.write("wusir".encode("utf-8"))  # 写入时必须转化成bytes数据

 f.flush()

 f.close()

　文本文件的复制：

 f1 = open(r"e:\Python_workspace\王尼玛.txt",mode="r",encoding="utf-8")

 f2 = open(r"g:\王尼玛.txt",mode="w",encoding="utf-8")

 for line in f1: # 从f1读取数据到变量

     f2.write(line) # 写入到f2中(关于写入清空:清空只会在open打开再首次write时清空，这里显然不是)

 f1.close()

 f2.close()

 #

 # gbk  utf-8 为文字编码  这里的复制方法只适用于文本

 # 若是图片/视频/音频等需编码成bytes再操作，见下

　　rb wb ab 把字符换成字节 仅此而已

　　b - bytes 读取和写入的是字节,用来操作非文本文件(图片， 音频， 视频）

 # 复制一张图片 从E盘到G盘，单纯的从bytes角度来复制（bytes适用于所有文件）

 f = open(r"E:\Python_workspace\问题1.jpg",mode="rb")

 f1 = open(r"g:\问题1.jpg",mode="wb")

 for line in f:  # 分批量读取bytes内容(复制的是 01 代码)

     f1.write(line) # 因为f1的mode模式有w写入

 f.close()

 f1.close()


r+ 读写  w+ 写读  a+ 追加写读 ：

# r+b 读写转换成字节  w+b 写读转换成字节  a+b 追加写读换成字节
# + 扩展

# r+ 读写 (较为常见的)

 # 正确的操作 先读后写

 f = open("person",mode="r+",encoding="utf-8")

 content = f.read()

 f.write("黄蓉")

 print(content)

 f.close()

 # 正常的读取之后,写在结尾

 # 错误的操作

 f = open("person",mode="r+",encoding="utf-8")

 f.write("赵敏") # 默认直接写入的话,在开头写入，会覆盖开头的内容

 content = f.read()

 print(content)

 # 坑  不论读取多少内容，再次写入时都是在末尾

 f = open("person",mode="r+",encoding="utf-8")

 content1 = f.read(3)

 f.write("郭芙")

 print(content1)

 f.close()

#  深坑请注意:在 r+ 模式下.如果读取内容.不论读取内容多少.显示的是多少.再写入或者操作文件时候都是在结尾进行的操作.


# w+ (几乎用不到)  （先清空再写入）

 # w+ (几乎用不到)  （先清空再写入）

 f = open("person",mode="w+",encoding="utf-8")

 f.write("你好，世界")  # 打开就写入会直接清空内容

 content = f.read() # 写入内容后 光标在末尾 读取不了内容

 print(content)

 f.close()

# a+ (很少使用)   追加写读

 # a+ (很少使用)   追加写读

 # 不论光标在何处 写入的时候都是在末尾

 f = open("person",mode="a+",encoding="utf-8")

 f.write("东方不败") # 默认写在末尾

 content = f.read()

 print(content)

 f.close()


光标 seek(参数1，参数2):

# seek(参数1，参数2)
# 参数1表示的是偏移量,移动多少个单位
# 参数2表示从什么位置进行偏移
# 0: 开头
# 1: 当前位置
# 2: 末尾

# 光标移动到n位置，注意移动的单位是byte，所以如果是utf-8中文部分则为3的倍数。
# 移动到开头：seek(0)
# 移动到结尾：seek(0，2)

 f = open("person",mode="r",encoding="utf-8")

 f.seek(0) # 以字节为单位

 f.seek(2)

 print(f.read(2)) # 读取两个字符

 # tell() 返回当前光标的位置

 info = f.read(3) # utf-8 3*3 9个字节

 print(info)

 print(f.tell()) # 获取光标的位置

# truncate() 截取截断文件(慎用)(特别服务器内)

 f = open("person",mode="w",encoding="utf-8")

 f.seek(3)  # 光标移动到3

 print(f.tell())

 # f.truncate() # 后面所有内容都删掉

 f.truncate(3) # 从头到3截取

 f.close()

# 文件修改：

　　固定模块 import.os

　　os.remove()

　　os.rename()

 import os  # 导入 os 模块

 import time # 导入时间模块

 # 优点： 不使用句柄，自动关闭连接

 with open("唐诗",mode="r",encoding="utf-8") as f1,\

     open("唐诗_副本",mode="w",encoding="utf-8") as f2:

     for line in f1:

         line = line.replace("与","yu")

         f2.write(line)

 time.sleep(3)

 os.remove("唐诗")  # 删除源文件

 time.sleep(3)

 os.rename("唐诗_副本","唐诗") # 把副本改名成源文件

# 文件操作应用练习：

# 把数据归类 增添数据时自动按格式排列
'''
1,榴莲,500,60000
2,苹果,700,70000
3,荔枝,600,60000
4,西瓜,800,70000
'''

 # 1.

 f = open(r"水果.txt",mode="r",encoding="utf-8")

 lis = []

 for line in f:

     lis.append(line)

 print(lis)  # 没有清晰的分类 仅把每排关联数据作为一个元素装到了lis

 # ['1,榴莲,500,60000\n', '2,苹果,700,70000\n', '1,榴莲,500,60000\n', '2,苹果,700,70000']

 # 2.

 lis = []

 # dic = {} # 循环 不可放在这里

 f = open(r"水果.txt",mode="r",encoding="utf-8")

 for line in f:  # "1，苹果,500,60000"——》弄成字典效果——》{id:1，name:苹果, num:500, price:60000}

     dic = {} # dic定义字典变量不可放在循环之前 否则只会有一个元素重复添加到lis

     li = line.strip().split(",")

     dic["id"] = li[0]

     dic["name"] = li[1]

     dic["num"] = int(li[2])

     dic["price"] = int(li[3])

     lis.append(dic)

 print(lis)

 f.close()

 # 3.若改动开头 第一行 id,name,price,num 以及在里面增添数据怎么写？

 f = open(r"水果.txt",mode="r",encoding="utf-8")

 title = f.readline().strip()  # 读取第一行  id,name,price,num

 lis = title.split(",")  # 字符串分割成列表 ['id', 'name', 'price', 'num']

 lis1 = []

 for line in f:

     dic = {}

     li = line.strip().split(",")

     for i in range(len(lis)):

         dic[lis[i]] = li[i]

     lis1.append(dic)

 print(lis1) # [{'id': '1', 'name': '榴莲', 'price': '500', 'num': '60000'}, {'id': '2', 'name': '苹果', 'price': '700', 'num': '70000'}, {'id': '3', 'name': '荔枝', 'price': '600', 'num': '60000'}, {'id': '4', 'name': '西瓜', 'price': '800', 'num': '70000'}]

 f.close()

 '''

 添加修改数据：

 序号,名字,价格,数量,仓库

 1,榴莲,500,60000,仓库01

 2,苹果,700,70000,仓库02

 3,荔枝,600,60000,仓库02

 4,西瓜,800,70000,仓库03

 '''

 # 再次打印：

 # [{'序号': '1', '名字': '榴莲', '价格': '500', '数量': '60000', '仓库': '仓库01'}, {'序号': '2', '名字': '苹果', '价格': '700', '数量': '70000', '仓库': '仓库02'}, {'序号': '3', '名字': '荔枝', '价格': '600', '数量': '60000', '仓库': '仓库02'}, {'序号': '4', '名字': '西瓜', '价格': '800', '数量': '70000', '仓库': '仓库03'}]

秒客网

第九天- 文件操作 r w a 文件复制/修改

相关文章