web_explorer:Web扫描程序,获取页面内容以及以下链接

时间:2024-05-21 06:26:32
【文件属性】:

文件名称:web_explorer:Web扫描程序,获取页面内容以及以下链接

文件大小:1.55MB

文件格式:ZIP

更新时间:2024-05-21 06:26:32

Python

web_explorer Web_explorer是一个小型的Python网络搜寻器,可从其访问的网站中检索文本内容,以便随后对其进行分析。 该软件仍处于开发中的beta版本,使用后果自负 :face_with_tongue: 此模块允许指定URL列表作为第一级。 它遵循起始网站中的一定数量的超链接(redirect_count),探索起始网站的内容,然后访问到上一级中找到的其他网站的链接。 安装 无需安装,只需使用Python运行程序即可: python main.py 或者可以使用命令行工具: python webExplore.py -h 例子 请参见文件main.py可以使用类函数配置脚本。 这里给出一个例子: #1) Declare a webExplorer instance, using 3 redirect per website and 3 depths levels myWebExplore


【文件预览】:
web_explorer-master
----main.py(3KB)
----web_explorer.py(75KB)
----LICENSE(31KB)
----webExplore.py(4KB)
----dictionaries()
--------US.dic(1.16MB)
--------dk.dic(3.83MB)
----watchdog.py(2KB)
----README.md(2KB)

网友评论