一、HTTP概述
1、WEB客户端和服务器。
2、资源:资源可以是各种格式的静态文件,也可以是应用程序。
3、媒体类型
4、URI:统一资源标识符
URL:统一资源定位符。
URL的第一部分称为方案:说明访问资源所使用的协议类型。通常就是HTTP协议。
URL的第二部分给出了服务器的因特网地址。
其他部分指定了服务器上的资源路径。目前,几乎所有的URI都是URL。
URN:统一资源名。
5、事物:由客户端的请求命令和服务器的响应结果组成。
6、连接:基于TCP/IP协议。
7、代理
8、缓存
9、网关
10、隧道
11、Agent代理(爬虫)
二、URL和资源
URL 组成:protocol ://<user>:<password>@<host>:<port> /<path>;<parame>?<query>#<frag>
绝对URL和相对URL。
自动扩展URL:主机名扩展、历史扩展。
URL字符集和编码机制。
三、报文详解