前言
之前介绍Python的 pathlib 模块可以有效的路径及文件查找等方便操作,本篇介绍一个相对 readlines() 获取文件内容更高效的用法
fileinput模块
对一个或者多个文件的内容迭代遍历(类似文件操作的readlines()),但是返回的是
迭代对象
,而不是一次性返回所有的文件内容行记录。
1、用法介绍
- • files 是要操作的文件列表,多文件格式为 ['f1.txt', 'f2.txt'],
默认是标准输入
- • inplace 是否将处理的结果
写回文件
,默认是不写回 - • backup 是否开启备份,开启的时候,只需要
指定备份的扩展名即可
,如果备份已经存在则会覆盖 - • mode 读写的模式,默认是只读
- • encoding 文件编码
2、常用到的函数
- • fileinput.input() 返回迭代对象,使用for循环读取。可以配合 with 使用
- • fileinput.filename() 返回当前文件名称
- • fileinput.lineno() 返回当前已经读取的
行的数量
注意和 filelineno的区别 - • fileinput.filelineno() 返回单签读取的行的行号
- • fileinput.isfirstline() 检查单签行是否是文件的第一行
- • fileinput.isstdin() 判断
最后一行
是否从标准stdin中读取 - • fileinput.close() 关闭文件,配置with使用的时候,不需要显著关闭
3、案例demo
3.1、 基于标准输入和命令行文件参数
命令行不加任何参数,表示从标准输入 stdin 获取信息
image-20221209170647696
命令行有参数(文件)则读取文件内容
image-20221209170923786
3.2、修改多个文件,并回写
到源文件
image-20221209172108029
3.3、文件内容替换,并备份原文件
执行脚本之后,发现 1209_demo.txt 文件中第一行的Python
变成了Django
3.4、利用``fileinput + re` 实现邮箱提取
执行脚本之后
Demo演示就到这里,通过案例学习它的方法怎么用,然后具体结合自己业务就好。
有问题,欢迎交流 ~
原文地址 [Python模块fileinput操作文件和目录操作总结][1]