基于Python实现的死链接自动化检测工具

时间:2022-01-12 14:05:14

基于Python实现的死链接自动化检测工具

 

by:授客 QQ:1033553122


测试环境:

win7

python 3.3.2

chardet 2.3.0

脚本作用:

检测系统中访问异常(请求返回code值非200)的链接

使用方法:

1. 配置

编辑deadLinkDetection\conf\init.conf

配置项如下

protocol:协议,比如https,
http

host:主机、域名,如192.168.1.3

port:端口号,比如 80, 8080, 443

username:配置登录用户名

password:配置登录密码

2.配置种子url

编辑conf/urlNoLogin.txt文件中填写不需要登录就可访问的种子url,格式如下,每行一条url路径

/

/doc/sadmin.html/

/doc/refman/5.7/en/statement-optimization.html
/doc/homepage.html

在conf/urlNeedLogin.txt文件中填写需要登录才可访问的种子url,格式同上

3. 根据项目实际情况,修改main.py中login_system函数,实现登录系统

4. 运行程序

cmd 进入到deadLinkDetection目录,运行
python main.py

5. 查看运行结果

除了控制台打印的输出,默认的,还会在d:\\目录下,生成filepath_of_urls_visited.txt,
d:/filepath_of_urls_in_trouble.txt文件,

分别存放成功访问过的url链接,和访问异常的链接,可在main.py中找到代码行“reptile = Reptile()”,显示指定要生成的文件,如下:

reptile = Reptile('d:/xxxxx_visited.txt',
'd:/xxxxx_in_trouble.txt)

使用限制:

登录系统函数无法通用,需要自己实现

源码下载地址:基于Python实现的死链接自动化检测工具.zip