file 文件处理

时间:2023-12-15 15:59:26

python文件处理

#写文件
>>> f=open("test.log","w") #"w"写入模式
>>> f.write("test line\n")
10
>>> f.write("test line2")
11
>>> f.close() #操作完毕记得关闭文件!
#读文件
>>> f=open("test.log","r") #"r"只读模式
>>> print(f.read())
test line
test line2
>>> f.close() #关闭文件对象
文件句柄 f = open('文件路径', '模式',encoding='编码') 

文件编码 encoding:

open() 文件是由操作系统打开,如果没有手动设置编码,那么默认操作系统会用自己的编码去打开文件,在linux下是utf-8,windows下是 gbk。

打开模式:

  • r  只读模式(默认),文件必须存在,否则会抛异常
  • w  写入模式,需要注意:若文件已存在,会覆盖掉原来的内容!
  • x  写入模式,若文件已存在,会报异常
  • a  追加。不存在则创建,存在就追加
  • t  文本模式打开 (默认)。 open()函数默认的打开模式是'rt'
  • b  以二进制读文件。对于非文本文件,使用b模式,“b”表示以字节的方式操作
  • +  可读写模式

文件对象的方法:

  • f.close()   回收操作系统打开的文件
  • f.read([size=-1])      size未指定则读取整个文件,读取到的是字符串
    # f.read(10)
    如果文件以t(文本模式)打开,则读取10个字符
    若文件以b(二进制模式)打开,则读取10个字节
    # f.read()
    >>> f = open('a.txt','r')
    >>> data = f.read().strip()
    >>> data
    'test line1\ntest line2'
    >>> print(data)
    test line1
    test line2
    >>> f.close()
  • f.readline([size=-1])    每次读一行内容,所以,读取时占用内存小,比较适合大文件
    >>> f = open('a.txt')
    >>> f.readline()
    'test line1\n'
    >>> f.readline()
    'test line2\n'
    >>> f.readline()
    ''
    >>> f.readline()
    ''
    >>> f.close()
  • f.readlines([size=-1])    读取整个文件所有行,保存在一个列表中,每行作为一个元素
    >>> f=open("a.txt")
    >>> data=f.readlines()
    >>> f.close()
    >>> data
    ['test line1\n', 'test line2\n', '\n'] #读取到的是一个列表
    >>> for line in data:
    ... print(line.strip())
    ...
    test line1
    test line2
  • f.tell()     返回当前文件指针的位置
    >>> f=open('record.txt')
    >>> f.read(5)
    '小客服:小'
    >>> f.tell()
    13

      

  • f.seek(offset,from) 移动光标, 从from(0代表文件起始位置,1代表当前位置,2代表文件末尾)偏移offset个字节
    # cat a.txt
    test line1
    test line2
    >>> f=open("a.txt")
    >>> f.seek(8) #把光标移到第8个字符的后面
    8
    >>> f.tell()
    8
    >>> f.read()
    'e1\ntest line2\n'
    >>> f.close()
  • f.truncate([size=file.tell()])    从文件的首字符开始截断 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除。文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果
    >>> f=open('a.txt','r+')  #文件打开必须是可写的,在r+或a或a+模式下测试
    >>> f.truncate(8)
    8
    >>> f.read()
    'test lin'
    >>> f.tell()
    8
    >>> f.close()
  • f.write(str)      将字符串str写入文件,返回写入的字符串长度
  • f.writelines(seq)   向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符
    >>> l = ['hello\n','world\n']
    >>> f=open("test.log","w")
    >>> f.writelines(l)
    >>> f.close()
    # cat test.log
    hello
    world

with管理上下文

为了防止文件操作完忘记执行 f.close()来关闭文件,可以使用with 关键字来管理上下文, 当with代码块执行完毕时,内部会自动关闭并释放文件资源。

>>> with open('server.py') as f:
... for i in f:
... print(i.strip())
... #with还支持同时对多个文件的上下文进行管理 >>> with open('a.txt','r') as obj1,open('b.txt','w') as obj2:
... data = obj1.read() # 文件较大时,应使用for循环一行一行的读取, for i in obj1: obj2.write(i)
... obj2.write(data)
...
4

修改文件内容:

import os
with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
for line in read_f:
line=line.replace('test','xxxx')
write_f.write(line)
os.rename('.a.txt.swap','a.txt')
os.remove('a.txt')

把一个文件的内容插入到另一个文件某个指定字段的前面

#!/usr/bin/python3
with open('add.txt','r') as obj1,open('filebeat.yml','r') as obj2:
add_content = obj1.read()
content = obj2.read()
pos = content.index('output.kafka:') contents = content[:pos] + add_content + content[pos:]
with open('filebeat.yml','w') as f:
f.write(contents)