文件名称:油田英语文学选论
文件大小:3KB
文件格式:ZIP
更新时间:2024-03-16 03:25:39
Python
油田英语文学选论 1.遍历文件夹下的子文件夹; 2.遍历子文件夹下的pdf文档(text_path),获取名称(Field_name); 3.读取pdf文档,将整篇文章存成字符串; 4.检索字符串中Field_name和“参考”或“参考”或“ REFERENCE”或“ REFERENCES”的位置; 5.比较两者的位置,如果字段仅出现在引用之后,而且文章中存在引用,则返回text_path,可以将text_path写入false_field_name_0.txt; 6.读取false_field_name_0.txt获得不符合的文件的路径,将不符合的文件移出原文件夹放到“ D:\文件更新\ Refer_Update0203 \ 1”文件夹中。
【文件预览】:
Selection-of-English-literature-of-Oilfield-main
----油田英文文献筛选.py(4KB)
----README.md(715B)