EmailCrawler:用python编写的电子邮件爬虫

时间:2024-06-15 15:16:43
【文件属性】:

文件名称:EmailCrawler:用python编写的电子邮件爬虫

文件大小:7KB

文件格式:ZIP

更新时间:2024-06-15 15:16:43

python emails web-scraping email-crawler web-urls

电子邮件搜寻器 这段python代码只是对给定的网址进行爬网,以查找潜在的电子邮件,并将其保存在文本文件中。 Web URL必须在用换行符分隔的文本文件中指定。 动机 如果知道相关的Web URL,这将有助于自动执行查找相关电子邮件地址的任务的脚本。 依存关系 为了使用此库,需要python模块。 sys urllib 用法 克隆存储库并使用以下代码。 使用命令行参数直接从控制台运行命令到文件emailcrawler.py。 命令行参数解释为: emailcrawler.py [filename] 例如, $ python emailcrawler.py example.txt example.txt包含用换行符分隔的Web URL,电子邮件地址将在该URL上定位和保存。 此命令将保存三个文本文件,分别是email_addresses.txt(包含找到的电子邮件地址),emai


【文件预览】:
EmailCrawler-master
----.gitignore(3KB)
----example.txt(86B)
----emailcrawler.py(6KB)
----LICENSE(1KB)
----email_addresses.txt(532B)
----README.md(1KB)
----email_addresses_withurl.txt(2KB)
----.gitattributes(483B)
----info.txt(92B)

网友评论