ExtractEmailFromPDF:从.pdf | .txt | .docx之类的文本文件中获取电子邮件和电话号码

时间:2024-06-02 15:39:15
【文件属性】:

文件名称:ExtractEmailFromPDF:从.pdf | .txt | .docx之类的文本文件中获取电子邮件和电话号码

文件大小:5KB

文件格式:ZIP

更新时间:2024-06-02 15:39:15

Python

在此路径中拖动文件( pdf | docx | txt )或目录(我们可以递归读取所有文件) pip install -r requirements.txt python execute.py (请耐心等待,可能需要花费几分钟的时间) 在./output_csv获取您的.csv 对于.doc(真的是烫手山芋!),请使用google方法将os上的.doc转换为.docx | .pdf | .txt。 请先转换它们,然后再运行此py。


【文件预览】:
ExtractEmailFromPDF-master
----.gitignore(1KB)
----requirements.txt(19B)
----execute.py(3KB)
----utils()
--------__init__.py(98B)
--------from_docx.py(1KB)
--------from_txt.py(704B)
--------from_pdf.py(2KB)
----example.py(557B)
----readme.md(374B)

网友评论