wget常用下载命令

时间:2022-01-22 11:47:32

wget

wget是一个从网络上自动下载文件的*工具,支持通过HTTP、HTTPS、FTP三个最常见的TCP/IP协议下载,并可以使用HTTP代理。wget名称的由来是“World Wide Web”与“get”的结合。

1、wget下载单个文件

#wget http://domain/file

下载的时候会显示:文件的大小、保存的名称、进度条、下载速度、时间

root@kali:~# wget https://curl.haxx.se/download/curl-7.54.1.zip
---- ::-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.74.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.74.49|:... 已连接。
已发出 HTTP 请求,正在等待回应... OK
长度: (4.9M) [application/zip]
正在保存至: “curl-7.54..zip” curl-7.54..zip %[===========> ] .25K .7KB/s eta 2m 8s ^

2、指定保存的名称

#wget -O newName http://domain/file

默认情况wget会用斜杠‘/’后面的字符来命名保存的名称

root@kali:~# wget http://xiazai.zol.com.cn/down.php?softid=442597&subcateid=1446&site=10&checkStr=066ab9d88b1f0c534&pos=downloader_main&rand=1200a2
正在保存至: “down.php?softid=442597”

显然这种特殊格式下载地址得出的命名不是我们想要的,即可用-O参数来自定义命名

root@kali:~# wget -O testName http://xiazai.zol.com.cn/down.php?softid=442597&subcateid=1446&site=10&checkStr=066ab9d88b1f0c534&pos=downloader_main&rand=1200a2
[]
[]
[]
[]
[]
root@kali:~# ---- ::-- http://xiazai.zol.com.cn/down.php?softid=442597
正在解析主机 xiazai.zol.com.cn (xiazai.zol.com.cn)... 123.103.57.124
正在连接 xiazai.zol.com.cn (xiazai.zol.com.cn)|123.103.57.124|:... 已连接。
已发出 HTTP 请求,正在等待回应... OK
长度: [text/html]
正在保存至: “testName” testName [ <=> ] --.-KB/s in 0s

3、断点续传

#wget -c http://domain/file

适用于下载大文件或者网络不好的情况,需要服务器支持断点续传

不停重连,直到连接成功
root@kali:~# wget -c https://curl.haxx.se/download/curl-7.54.1.zip -t参数表示重连次数,表示只重连10次,-t为0时不限制
root@kali:~# wget -c -t https://curl.haxx.se/download/curl-7.54.1.zip -T参数表示超时等待时间,以秒为单位,表示60秒连不上超时
root@kali:~# wget -c -T https://curl.haxx.se/download/curl-7.54.1.zip

4、指定下载速度

#wget --limit-rate=1024k http://domain/file

表示限制速度为1MB/s

root@kali:~# wget --limit-rate=1024k https://curl.haxx.se/download/curl-7.54.1.zip
---- ::-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.74.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.74.49|:... 已连接。
已发出 HTTP 请求,正在等待回应... OK
长度: (4.9M) [application/zip]
正在保存至: “curl-7.54..zip.” curl-7.54..zip. %[==========> ] .33K .3KB/s eta 54s ^

5、批量下载

#wget -i download.txt

多个下载链接可以分行写在文本中,实现批量下载

6、选择性下载

#wget -m --accept=jpg http://domain/dir  //--accept参数表示可以接受的文件类型

#wget -m --reject=jpg http://domain/dir  //--reject参数表示拒绝接受的文件类型

或者

#wget -r -A.jpg http://domain/dir  //表示下载所有jpg文件

7、后台下载

#wget -b http://domain/file

后台下载时,会在当前目录中产生wget-log文件

root@kali:~# wget -b https://curl.haxx.se/download/curl-7.54.1.zip
继续在后台运行,pid 为 。
将把输出写入至 “wget-log”。
root@kali:~# cat wget-log
---- ::-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.74.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.74.49|:... 已连接。
已发出 HTTP 请求,正在等待回应... OK
长度: (4.9M) [application/zip]
正在保存至: “curl-7.54..zip.” 0K .......... .......... .......... .......... .......... % .9K 67s
50K .......... .......... .......... .......... .......... % .6K 61s
100K .......... .......... .......... .......... .......... % .8K 73s

8、利用代理服务器下载

如果下载需要经过代理服务器,wget可以通过代理服务器进行下载。

方法一、在环境变量中设置代理

export http_proxy=0.0.0.0:

方法二、使用配置文件

可以直接修改/etc/wgetrc,也可以当前目录下创建.wgetrc文件,配置代理服务器

https-proxy = 0.0.0.0:     //https代理服务器
http-proxy = 0.0.0.0: //http代理服务器
ftp-proxy = 0.0.0.0: //ftp代理服务器
use_proxy = on  //开启代理

这里 use_proxy = on 开启了代理,如果不想使用代理,每次都修改此文件太麻烦,我们可以在命令中使用-Y参数来临时设置:

-Y, --proxy=on/off           打开或关闭代理

方法三、使用-e参数

适用于临时代理

-e参数表示运行一个“.wgetrc”风格的命令
#wget -e "http-proxy=0.0.0.0:8080" http://domain/file

注意:如果代理服务器需要密码则使用

--proxy-user=代理用户
--proxy-passwd=代理密码

9、测试下载地址是否有效

#wget --spider DOWNLOAD-URL

正确的下载地址会显示

root@kali:~# wget --spider https://curl.haxx.se/download/curl-7.54.1.zip
打开 Spider 模式。检查是否存在远程文件。
---- ::-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.78.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.78.49|:... 已连接。
已发出 HTTP 请求,正在等待回应... OK
长度: (4.9M) [application/zip]
存在远程文件。

无效的下载地址会显示

root@kali:~# wget --spider https://curl.haxx.se/download/xxx.zip
打开 Spider 模式。检查是否存在远程文件。
---- ::-- https://curl.haxx.se/download/xxx.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.78.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.78.49|:... 已连接。
已发出 HTTP 请求,正在等待回应... Not Found
远程文件不存在 -- 链接失效!!!

10、FTP下载

匿名FTP

wget ftp-url

需登陆认证的FTP

wget --ftp-user=USERNAME --ftp-password=PASSWORD DOWNLOAD-URL

11、针对提示没有认证不允许下载

wget --no-check-certificate DOWNLOAD-URL  //不要验证服务器的证书。

12、下载一个完整的网站

适用于完整下载一个网站用于本地浏览

wget --mirror -p --convert-links -P LOCAL-DIR WEBSITE-URL

--mirror:打开镜像选项
-p:下载所有用于显示给定网址所必须的文件
--convert-links:下载以后,转换链接用于本地显示
-P LOCAL_DIR:保存所有的文件或目录到指定的目录下

待更新。。。