file 文件处理

python文件处理

#写文件

>>> f=open("test.log","w")   #"w"写入模式

>>> f.write("test line\n")

10

>>> f.write("test line2")

11

>>> f.close()    #操作完毕记得关闭文件！

#读文件

>>> f=open("test.log","r")  #"r"只读模式

>>> print(f.read())

test line

test line2

>>> f.close()    #关闭文件对象

文件句柄 f = open('文件路径', '模式'，encoding='编码')

文件编码 encoding：

open() 文件是由操作系统打开,如果没有手动设置编码，那么默认操作系统会用自己的编码去打开文件，在linux下是utf-8，windows下是 gbk。

打开模式：

r 只读模式（默认）,文件必须存在，否则会抛异常
w 写入模式，需要注意：若文件已存在，会覆盖掉原来的内容！
x 写入模式，若文件已存在，会报异常
a 追加。不存在则创建，存在就追加
t 文本模式打开 (默认)。 open()函数默认的打开模式是'rt'
b 以二进制读文件。对于非文本文件，使用b模式，“b”表示以字节的方式操作
+ 可读写模式

文件对象的方法：

f.close() 回收操作系统打开的文件

f.read([size=-1]) size未指定则读取整个文件,读取到的是字符串

# f.read(10)

如果文件以t（文本模式）打开，则读取10个字符

若文件以b（二进制模式）打开，则读取10个字节

# f.read()

>>> f = open('a.txt','r')

>>> data = f.read().strip()

>>> data

'test line1\ntest line2'

>>> print(data)

test line1

test line2

>>> f.close()

f.readline([size=-1]) 每次读一行内容，所以，读取时占用内存小，比较适合大文件

>>> f = open('a.txt')

>>> f.readline()

'test line1\n'

>>> f.readline()

'test line2\n'

>>> f.readline()

''

>>> f.readline()

''

>>> f.close()

f.readlines([size=-1]) 读取整个文件所有行，保存在一个列表中，每行作为一个元素

>>> f=open("a.txt")

>>> data=f.readlines()

>>> f.close()

>>> data

['test line1\n', 'test line2\n', '\n']   #读取到的是一个列表

>>> for line in data:

...     print(line.strip())

...

test line1

test line2

f.tell() 返回当前文件指针的位置

>>> f=open('record.txt')

>>> f.read(5)

'小客服:小'

>>> f.tell()

13

f.seek(offset,from）移动光标，从from（0代表文件起始位置，1代表当前位置，2代表文件末尾）偏移offset个字节

# cat a.txt

test line1

test line2

>>> f=open("a.txt")

>>> f.seek(8)  #把光标移到第8个字符的后面

8

>>> f.tell()

8

>>> f.read()

'e1\ntest line2\n'

>>> f.close()

f.truncate([size=file.tell()]) 从文件的首字符开始截断 size 个字符，无 size 表示从当前位置截断；截断之后后面的所有字符被删除。文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果
```
>>> f=open('a.txt','r+')  #文件打开必须是可写的，在r+或a或a+模式下测试

>>> f.truncate(8)

8

>>> f.read()

'test lin'

>>> f.tell()

8

>>> f.close()
```

f.write(str) 将字符串str写入文件,返回写入的字符串长度

f.writelines(seq) 向文件写入一个序列字符串列表，如果需要换行则要自己加入每行的换行符

>>> l = ['hello\n','world\n']

>>> f=open("test.log","w")

>>> f.writelines(l)

>>> f.close()

# cat test.log

hello

world

with管理上下文

为了防止文件操作完忘记执行 f.close()来关闭文件，可以使用with 关键字来管理上下文, 当with代码块执行完毕时，内部会自动关闭并释放文件资源。

>>> with open('server.py') as f:

... for i in f:

... print(i.strip())

...

 #with还支持同时对多个文件的上下文进行管理

>>> with open('a.txt','r') as obj1,open('b.txt','w') as obj2:

... data = obj1.read()   # 文件较大时，应使用for循环一行一行的读取， for i in obj1: obj2.write(i)

... obj2.write(data)

...

4

修改文件内容：

import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:

    for line in read_f:

        line=line.replace('test','xxxx')

        write_f.write(line)

os.rename('.a.txt.swap','a.txt')

os.remove('a.txt')

把一个文件的内容插入到另一个文件某个指定字段的前面

#!/usr/bin/python3

with open('add.txt','r') as obj1,open('filebeat.yml','r') as obj2:

    add_content = obj1.read()

    content = obj2.read()

pos = content.index('output.kafka:')

contents = content[:pos] + add_content + content[pos:]

with open('filebeat.yml','w') as f:

    f.write(contents)

相关文章