HTTP协议分析

时间:2023-12-06 09:30:02

一、域名概述

1、域名解析的作用:

主机数量增多时,IP地址不容易记忆,域名方便记忆。域名记忆更加直观。

2、hosts文件

早期通过hosts文件进行域名的解析,Linux系统中hosts文件存放路径为/etc/hosts,Windows系统中存放路径为C:\Windows\System32\drivers\etc\hosts内。

但后来随着Internet网上的网站发展迅速,一个小小的hosts文件以不足以存放,再加上主机名称数量庞大、主机维护困难等问题,出现了DNS域名解析服务

3、DNS(Domain Name System)域名系统

(1)两大特点:分布式、层次性

(2)域名空间结构:根域、*域(国家/地区域名)、二级域

(3)完整域名格式:FQDN=主机名.DNS后缀,例:www.sohu.com.

二、网页基本术语概述

1、网页:纯文本格式文件,其编写语言为HTML,在用户的浏览器中被“翻译”成网页形式显示出来

2、网站:网站是由一个一个页面构成的,是多个网页的结合体

3、主页:打开网站后出现的第一个网页称为网站主页(或首页 index.html)

(例如下图为www.sohu.com网站首页)

HTTP协议分析

4、域名:浏览网页时输入的网址(例如:www.sohu.com)

5、HTTP:用来传输网页的通信协议

6、URL:是一种万维网寻址系统

http://www.baidu.com.:80/jpg/1.jpg

7、HTML:用来编写网页的超文本标记语言

8、超链接:将网站中不同网页链接起来的功能

9、发布(上线):将制作好的网页上传到服务器供用户访问的过程

三、HTML(超文本标签语言)概述

1、HTML:Hyper Text Markup Language,编写网页的语言

2、浏览器:“解释和执行”HTML源码的工具

3、HTML文档的结构

头部部分

标题部分

主体部分

四、网页基本标签

1、头部部分

网页摘要信息的作用:有利于浏览器解析及搜索引擎的搜索

<title>  标题标签

<meta> 标签 (meta-information)针对搜索引擎和更新频度的描述和关键词

示例:

<head>
<title>测试网页</title>
	<meta name="keywords" content="云计算,Linux,网络服务,IT技术"/>
</head>

2、主体部分

1.标题标签

<h1>-<h6>  <h1>字号最大,<h6>字号最小

示例:

<body>
	<h1>一级标题</h1>
	<h2>二级标题</h2>
</body>

2.行控制相关标签

<p> 段落标签

示例:

<body>
	<h1>一级标题</h1>
	<h2>二级标题</h2>
	<p>这是一个段落</p>
</body>

<br /> 折行标签

示例:

<body>
	<h1>一级标题</h1>
	<h2>二级标题</h2>
	<p>这是一个段落</p>
	测试换行标签<br/>
</body>

3.范围标签

<span> 范围标签,组合文档中的行内元素

示例:

<body>
	<h1>一级标题</h1>
	<h2>二级标题</h2>
	<p>这是一个段落</p>
	测试换行标签<br/>
	<span>范围测试
	范围测试</span>			不加入其他属性的设置,无变化
</body>

4.图像标签

<img> 图像标签

示例:

<body>
<h1>一级标题</h1>
	<h2>二级标题</h2>
	<p>这是一个段落</p>
	测试换行标签<br/>
	<span>范围测试
	范围测试</span>
	<img src="E:\test.jpg"/>
</body>

5.超链接标签

<a> 超链接标签

示例:

<body>
	<h1>一级标题</h1>
	<h2>二级标题</h2>
	<p>这是一个段落</p>
	测试换行标签<br/>
	<span>范围测试
	范围测试</span>
	<img src="linux.png" />
	<a href="www.sohu.com">搜狐</a>
</body>

6.特殊符号

&nbsp;     空格符号

&quot;     “ 引号

&copy;     © 公司

&gt;        > 大于号

示例:

         &quot;Crushlinux.com&quot;&nbsp;&copy;版权所有

示例与展示:

<html>
<head>
	<title>我的测试网页</title>
	<meta name="keywords" content="云计算,LINUX,SHELL">
</head>
<body>
	<h1>一级标题测试</h1>
	<h3>三级标题测试</h3>
	<p>这是一个段落的测试</p>
	测试换行标签<br />
	<span style="color:red">范围测试</span><br />
	<img src="linux.png" /><br />
	<a href="www.sohu.com">搜狐</a>
	"Crushlinux.com" ©版权所有
</body>
</html>

将文件后缀改为.html,用浏览器打开

HTTP协议分析

五、Web概述

Web内容储存在Web服务器上,最简单的Web资源就是Web服务器文件系统中的静态文件,这些文件可以包含任意内容:文本文件、HTML文件、微软的Word文件、Adobe的Acrobat文件、JPEG图片文件、AVI电影文件。

资源不一定是静态文件,资源还可以是根据需要生成内容的软件程序。这些动态内容资源可以根据你的用户身份、所请求的信息或每天的不同时段来产生内容。

1、WEB1.0与WEB2.0

Web1.0是以编辑为特征,网站提供给用户的内容是编辑处理后提供的,然后用户阅读网站提供的内容。这个过程是网站到用户的单向行为。

Web2.0更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者。Web2.0加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与。

2、静态网页与动态网页

(1)静态网页

在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,扩展名是.htm、.html,可包含文本、图像、声音、FLASH动画、客户端脚本和ActiveX控件及JAVA小程序等。静态网页是网站建设的基础,早期的网站一般都是静态网页制作的。静态网页相对于动态网页而言,是没有后台数据库、是不含程序和可交互的网页。静态网页相对更新起来比较麻烦,适用于一般更新叫少的展示型网站(公司首页)。

每一个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有“?”。网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是存在在网站服务器上的,也就是说,静态网页是实实在在保存在服务器上的文件,每个网页都是一个独立的文件。

静态网页的内容相对稳定,因此容易被搜索引擎检索。

静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难。静态网页的交互性较差,在功能方面有较大的限制。页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面。

(2)动态网页

动态网页是与静态网页相对应的,网页URL的后缀不是.htm、.html、.shtml、xml等静态网页的常见形式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”

动态网页显示的内容可以随着时间、环境或者数据库操作的结果而发生改变。动态网页与网页上的各种动画、滚动字幕等视觉上的动态效果没有直接关系,只要是采用了动态网站技术生产的网页都可以称为“动态网页”。

动态网页是基本的html语法与Java、PHP等高级程序设计语言、数据库编程等多种技术的融合,以实现对网站内容和风格的高效、动态和交互式管理。

动态网页一般以数据库技术为基础,可以大大降低网站维护的工作量。采用动态网页技术的网站可以实现更多的功能,如用户注册、用户登录、在线调查、用户管理、订单管理等等。

动态网页实际上并不是独立存在于服务器上的网页文件,只有当用户请求时服务器才返回一个完整的网页。

动态页面中的“?”对搜索引擎检索存在一定的问题,搜索引擎一般不可能从一个网站的数据库中访问全部网页,或者处于技术方面的考虑,搜索之中不去抓取网址中“?”后面的内容,因此采用动态网页的网站在进行搜索引擎推广时需要做一定的技术处理(伪静态)才能适应搜索引擎的要求。

动态网页语言:

动态网页语言是指编写动态网页相关程序的计算机高级语言。目前,最常用的动态网页语言有ASP(Active Server Pages),JSP(Java Server Pages),PHP (Hypertext Preprocessor)。

在各自的应用范围中,ASP只能运行于微软的服务器产品上。Unix下也有ChiliSoft的插件来支持ASP,但是ASP本身的功能有限,必须通过ASP+COM的组合来扩充,Unix下的COM实现起来非常困难。而PHP3可在Windows、Unix、Linux的Web服务器上正常运行,还支持IIS,Apache等通用Web服务器,用户更换平台时,无需变换PHP3代码,可即拿即用.  JSP同PHP3类似,几乎可以运行于所有平台。如Win NT、Linux、Unix。NT下IIS通过一个插件,例如JRUN或者ServletExec,就能支持JSP。著名的Web服务器Apache已经能够支持JSP。虽然现在NT操作系统占了很大的市场份额,但是在服务器方面Unix的优势仍然很大,而新崛起的Linux更是来势不小。从一个平台移植到另外一个平台,JSP和JavaBean甚至不用重新编译,因为Java字节码都是标准的和与平台无关的。

声明:动态网页语言,内容来源于百度百科

六、HTTP协议分析

一、HTTP协议概述

每天都有数以亿万计的JPEG图片、HTML页面、文本文件、MPEG电影、WAV音频文件、JAVA小程序和其他资源在因特网上游弋。HTTP可以通过遍布全世界的Web服务器上将这些信息快迅速、便捷、可靠地搬移到人们桌面上的Web浏览器上去。

Web服务器所使用的是HTTP协议,因此经常会被称为HTTP服务器。HTTP服务器存储了因特网中的数据,如果HTTP客户端发出请求的话,它们会提供数据,客户端向服务器发送HTTP请求,服务器会在HTTP响应中回送所有请求的数据。

二、HTTP协议版本

HTTP协议是互联网上应用最为广泛的一种网络协议,设计这个协议的目的是为了发布和接收Web服务器上的HTML页面。

·HTTP 0.9

已过时。只接受 GET 一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持 POST 方法,所以客户端无法向服务器传递太多信息。

·HTTP 1.0

         这是第一个在通讯中指定版本号的HTTP 协议版本,至今仍被广泛采用,特别是在代理服务器中。

·HTTP 1.1

当前版本。持久连接被默认采用,并能很好地配合代理服务器工作。还支持以管道方式同时发送多个请求,以便降低线路负载,提高传输速度。

HTTP/1.1相较于 HTTP/1.0 协议的区别主要体现在:

  1. 缓存处理
  2. 带宽优化及网络连接的使用
  3. 错误通知的管理
  4. 消息在网络中的发送
  5. 互联网地址的维护
  6. 安全性及完整性

·HTTP 2.0

HTTP 2.0即超文本传输协议 2.0,是下一代HTTP协议。是由互联网工程任务组(IETF)的Hypertext Transfer Protocol Bis (httpbis)工作小组进行开发。是自1999年http1.1发布后的首个更新。HTTP 2.0在2013年8月进行首次合作共事性测试。在开放互联网上HTTP 2.0将只用于https://网址,而 http://网址将继续使用HTTP/1,目的是在开放互联网上增加使用加密技术,以提供强有力的保护去遏制主动攻击。DANE RFC6698允许域名管理员不通过第三方CA自行发行证书。

声明:HTTP协议版本,内容来源于百度百科

三、HTTP方法

HTTP支持几种不同的请求命令,这些命令被称为HTTP方法(HTTP method)每条HTTP请求报文会包含一个方法,告诉服务器要执行什么动作:

·获取一个Web页面

·运行一个网关程序

·删除一个文件等

HTTP协议有多种获得Web资源的方法,常用的有两种:GET和POST

GET和POST方法

例如访问:http://www.test.com/a.php?Id=123就是一个GET请求,如果访问正常,我们会从服务器的日志中获取200状态码。

假如此请求使用POST方法,那么我们会传递给a.php的Id参数依旧是123,但是浏览器的URL将不会显示后面的Id=123字样,因此表单类或者有用户名、密码等内容提交时建议使用POST方式。不管使用哪种方式,最终a.php获取到的值是一样的。

GET方法:从指定的服务器上获取数据               POST方法:提交数据给指定服务器处理

GET请求能被缓存                                                         POST请求不能被缓存

GET请求会保存在浏览器的浏览记录里               POST请求不会保存在浏览器的浏览记录里

GET请求要有长度的限制                                           POST请求没有长度的限制

主要用于获取数据                                                        查询的字符串不会显示在URL中,比较安全

查询的字符串会显示在URL中,不安全

四、HTTP状态码

当使用浏览器访问某一个URL,会根据请求URL返回状态码。

·通常整正常的状态码为2xx,3xx(如200)

·如果出现异常会返回4xx,5xx(如404)。

1、消息(1字头)

这一类型的状态码,代表请求已被接受,需要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。由于 HTTP/1.0 协议中没有定义任何 1xx 状态码,所以除非在某些试验条件下,服务器禁止向此类客户端发送 1xx 响应。

100 Continue

客户端应当继续发送请求。这个临时响应是用来通知客户端它的部分请求已经被服务器接收,且仍未被拒绝。客户端应当继续发送请求的剩余部分,或者如果请求已经完成,忽略这个响应。服务器必须在请求完成后向客户端发送一个最终响应。

101 Switching Protocols

服务器已经理解了客户端的请求,并将通过Upgrade 消息头通知客户端采用不同的协议来完成这个请求。在发送完这个响应最后的空行后,服务器将会切换到在Upgrade 消息头中定义的那些协议。

只有在切换新的协议更有好处的时候才应该采取类似措施。例如,切换到新的HTTP 版本比旧版本更有优势,或者切换到一个实时且同步的协议以传送利用此类特性的资源。

102 Processing

由WebDAV(RFC 2518)扩展的状态码,代表处理将被继续执行。

2、成功(2字头)

这一类型的状态码,代表请求已成功被服务器接收、理解、并接受。

200 OK

请求已成功,请求所希望的响应头或数据体将随此响应返回。

201 Created

请求已经被实现,而且有一个新的资源已经依据请求的需要而建立,且其 URI 已经随Location 头信息返回。假如需要的资源无法及时建立的话,应当返回 '202 Accepted'。

202 Accepted

服务器已接受请求,但尚未处理。正如它可能被拒绝一样,最终该请求可能会也可能不会被执行。在异步操作的场合下,没有比发送这个状态码更方便的做法了。

返回202状态码的响应的目的是允许服务器接受其他过程的请求(例如某个每天只执行一次的基于批处理的操作),而不必让客户端一直保持与服务器的连接直到批处理操作全部完成。在接受请求处理并返回202状态码的响应应当在返回的实体中包含一些指示处理当前状态的信息,以及指向处理状态监视器或状态预测的指针,以便用户能够估计操作是否已经完成。

203 Non-Authoritative Information

服务器已成功处理了请求,但返回的实体头部元信息不是在原始服务器上有效的确定集合,而是来自本地或者第三方的拷贝。当前的信息可能是原始版本的子集或者超集。例如,包含资源的元数据可能导致原始服务器知道元信息的超集。使用此状态码不是必须的,而且只有在响应不使用此状态码便会返回200 OK的情况下才是合适的。

204 No Content

服务器成功处理了请求,但不需要返回任何实体内容,并且希望返回更新了的元信息。响应可能通过实体头部的形式,返回新的或更新后的元信息。如果存在这些头部信息,则应当与所请求的变量相呼应。

如果客户端是浏览器的话,那么用户浏览器应保留发送了该请求的页面,而不产生任何文档视图上的变化,即使按照规范新的或更新后的元信息应当被应用到用户浏览器活动视图中的文档。

由于204响应被禁止包含任何消息体,因此它始终以消息头后的第一个空行结尾。

205 Reset Content

服务器成功处理了请求,且没有返回任何内容。但是与204响应不同,返回此状态码的响应要求请求者重置文档视图。该响应主要是被用于接受用户输入后,立即重置表单,以便用户能够轻松地开始另一次输入。

与204响应一样,该响应也被禁止包含任何消息体,且以消息头后的第一个空行结束。

206 Partial Content

服务器已经成功处理了部分 GET 请求。类似于 FlashGet 或者迅雷这类的 HTTP下载工具都是使用此类响应实现断点续传或者将一个大文档分解为多个下载段同时下载。

该请求必须包含 Range 头信息来指示客户端希望得到的内容范围,并且可能包含 If-Range 来作为请求条件。

响应必须包含如下的头部域:

Content-Range 用以指示本次响应中返回的内容的范围;如果是 Content-Type 为 multipart/byteranges 的多段下载,则每一 multipart 段中都应包含 Content-Range 域用以指示本段的内容范围。假如响应中包含 Content-Length,那么它的数值必须匹配它返回的内容范围的真实字节数。

Date

ETag 和/或 Content-Location,假如同样的请求本应该返回200响应。

Expires, Cache-Control,和/或 Vary,假如其值可能与之前相同变量的其他响应对应的值不同的话。

假如本响应请求使用了 If-Range 强缓存验证,那么本次响应不应该包含其他实体头;假如本响应的请求使用了 If-Range 弱缓存验证,那么本次响应禁止包含其他实体头;这避免了缓存的实体内容和更新了的实体头信息之间的不一致。否则,本响应就应当包含所有本应该返回200响应中应当返回的所有实体头部域。

假如 ETag 或 Last-Modified 头部不能精确匹配的话,则客户端缓存应禁止将206响应返回的内容与之前任何缓存过的内容组合在一起。

207 Multi-Status

由WebDAV(RFC 2518)扩展的状态码,代表之后的消息体将是一个XML消息,并且可能依照之前子请求数量的不同,包含一系列独立的响应代码。

3、重定向(3字头)

这类状态码代表需要客户端采取进一步的操作才能完成请求。通常,这些状态码用来重定向,后续的请求地址(重定向目标)在本次响应的 Location 域中指明。

当且仅当后续的请求所使用的方法是 GET 或者 HEAD 时,用户浏览器才可以在没有用户介入的情况下自动提交所需要的后续请求。客户端应当自动监测无限循环重定向(例如:A->A,或者A->B->C->A),因为这会导致服务器和客户端大量不必要的资源消耗。按照 HTTP/1.0 版规范的建议,浏览器不应自动访问超过5次的重定向。

300 Multiple Choices

被请求的资源有一系列可供选择的回馈信息,每个都有自己特定的地址和浏览器驱动的商议信息。用户或浏览器能够自行选择一个首选的地址进行重定向。

除非这是一个 HEAD 请求,否则该响应应当包括一个资源特性及地址的列表的实体,以便用户或浏览器从中选择最合适的重定向地址。这个实体的格式由 Content-Type 定义的格式所决定。浏览器可能根据响应的格式以及浏览器自身能力,自动作出最合适的选择。当然,RFC 2616规范并没有规定这样的自动选择该如何进行。

如果服务器本身已经有了首选的回馈选择,那么在 Location 中应当指明这个回馈的 URI;浏览器可能会将这个 Location 值作为自动重定向的地址。此外,除非额外指定,否则这个响应也是可缓存的。

301 Moved Permanently

被请求的资源已永久移动到新位置,并且将来任何对此资源的引用都应该使用本响应返回的若干个 URI 之一。如果可能,拥有链接编辑功能的客户端应当自动把请求的地址修改为从服务器反馈回来的地址。除非额外指定,否则这个响应也是可缓存的。

新的永久性的URI 应当在响应的 Location 域中返回。除非这是一个 HEAD 请求,否则响应的实体中应当包含指向新的 URI 的超链接及简短说明。

如果这不是一个 GET 或者 HEAD 请求,因此浏览器禁止自动进行重定向,除非得到用户的确认,因为请求的条件可能因此发生变化。

注意:对于某些使用 HTTP/1.0 协议的浏览器,当它们发送的 POST 请求得到了一个301响应的话,接下来的重定向请求将会变成 GET 方式。

302 Move temporarily

请求的资源临时从不同的 URI响应请求。由于这样的重定向是临时的,客户端应当继续向原有地址发送以后的请求。只有在Cache-Control或Expires中进行了指定的情况下,这个响应才是可缓存的。

上文有提及。

如果这不是一个 GET 或者 HEAD 请求,那么浏览器禁止自动进行重定向,除非得到用户的确认,因为请求的条件可能因此发生变化。

注意:虽然RFC 1945和RFC 2068规范不允许客户端在重定向时改变请求的方法,但是很多现存的浏览器将302响应视作为303响应,并且使用 GET 方式访问在 Location 中规定的 URI,而无视原先请求的方法。状态码303和307被添加了进来,用以明确服务器期待客户端进行何种反应。

303 See Other

对应当前请求的响应可以在另一个 URI 上被找到,而且客户端应当采用 GET 的方式访问那个资源。这个方法的存在主要是为了允许由脚本激活的POST请求输出重定向到一个新的资源。这个新的 URI 不是原始资源的替代引用。同时,303响应禁止被缓存。当然,第二个请求(重定向)可能被缓存。

注意:许多 HTTP/1.1 版以前的浏览器不能正确理解303状态。如果需要考虑与这些浏览器之间的互动,302状态码应该可以胜任,因为大多数的浏览器处理302响应时的方式恰恰就是上述规范要求客户端处理303响应时应当做的。

304 Not Modified

如果客户端发送了一个带条件的 GET 请求且该请求已被允许,而文档的内容(自上次访问以来或者根据请求的条件)并没有改变,则服务器应当返回这个状态码。304响应禁止包含消息体,因此始终以消息头后的第一个空行结尾。

该响应必须包含以下的头信息:

Date,除非这个服务器没有时钟。假如没有时钟的服务器也遵守这些规则,那么代理服务器以及客户端可以自行将 Date 字段添加到接收到的响应头中去(正如RFC 2068中规定的一样),缓存机制将会正常工作。

ETag 和/或 Content-Location,假如同样的请求本应返回200响应。

Expires, Cache-Control,和/或Vary,假如其值可能与之前相同变量的其他响应对应的值不同的话。

假如本响应请求使用了强缓存验证,那么本次响应不应该包含其他实体头;否则(例如,某个带条件的 GET 请求使用了弱缓存验证),本次响应禁止包含其他实体头;这避免了缓存了的实体内容和更新了的实体头信息之间的不一致。

假如某个304响应指明了当前某个实体没有缓存,那么缓存系统必须忽视这个响应,并且重复发送不包含限制条件的请求。

假如接收到一个要求更新某个缓存条目的304响应,那么缓存系统必须更新整个条目以反映所有在响应中被更新的字段的值。

305 Use Proxy

被请求的资源必须通过指定的代理才能被访问。Location 域中将给出指定的代理所在的 URI 信息,接收者需要重复发送一个单独的请求,通过这个代理才能访问相应资源。只有原始服务器才能建立305响应。

注意:RFC 2068中没有明确305响应是为了重定向一个单独的请求,而且只能被原始服务器建立。忽视这些限制可能导致严重的安全后果。

306 Switch Proxy

在最新版的规范中,306状态码已经不再被使用。

307 Temporary Redirect

请求的资源临时从不同的URI 响应请求。

新的临时性的URI 应当在响应的 Location 域中返回。除非这是一个HEAD 请求,否则响应的实体中应当包含指向新的URI 的超链接及简短说明。因为部分浏览器不能识别307响应,因此需要添加上述必要信息以便用户能够理解并向新的 URI 发出访问请求。

如果这不是一个GET 或者 HEAD 请求,那么浏览器禁止自动进行重定向,除非得到用户的确认,因为请求的条件可能因此发生变化。

4、请求错误(4字头)

这类的状态码代表了客户端看起来可能发生了错误,妨碍了服务器的处理。除非响应的是一个 HEAD 请求,否则服务器就应该返回一个解释当前错误状况的实体,以及这是临时的还是永久性的状况。这些状态码适用于任何请求方法。浏览器应当向用户显示任何包含在此类错误响应中的实体内容。

如果错误发生时客户端正在传送数据,那么使用TCP的服务器实现应当仔细确保在关闭客户端与服务器之间的连接之前,客户端已经收到了包含错误信息的数据包。如果客户端在收到错误信息后继续向服务器发送数据,服务器的TCP栈将向客户端发送一个重置数据包,以清除该客户端所有还未识别的输入缓冲,以免这些数据被服务器上的应用程序读取并干扰后者。

400 Bad Request

1、语义有误,当前请求无法被服务器理解。除非进行修改,否则客户端不应该重复提交这个请求。

2、请求参数有误。

401 Unauthorized

当前请求需要用户验证。该响应必须包含一个适用于被请求资源的 WWW-Authenticate 信息头用以询问用户信息。客户端可以重复提交一个包含恰当的 Authorization 头信息的请求。如果当前请求已经包含了 Authorization 证书,那么401响应代表着服务器验证已经拒绝了那些证书。如果401响应包含了与前一个响应相同的身份验证询问,且浏览器已经至少尝试了一次验证,那么浏览器应当向用户展示响应中包含的实体信息,因为这个实体信息中可能包含了相关诊断信息。参见RFC 2617。

402 Payment Required

该状态码是为了将来可能的需求而预留的。

403 Forbidden

服务器已经理解请求,但是拒绝执行它。与401响应不同的是,身份验证并不能提供任何帮助,而且这个请求也不应该被重复提交。如果这不是一个 HEAD 请求,而且服务器希望能够讲清楚为何请求不能被执行,那么就应该在实体内描述拒绝的原因。当然服务器也可以返回一个404响应,假如它不希望让客户端获得任何信息。

404 Not Found

请求失败,请求所希望得到的资源未被在服务器上发现。没有信息能够告诉用户这个状况到底是暂时的还是永久的。假如服务器知道情况的话,应当使用410状态码来告知旧资源因为某些内部的配置机制问题,已经永久的不可用,而且没有任何可以跳转的地址。404这个状态码被广泛应用于当服务器不想揭示到底为何请求被拒绝或者没有其他适合的响应可用的情况下。出现这个错误的最有可能的原因是服务器端没有这个页面。

405 Method Not Allowed

请求行中指定的请求方法不能被用于请求相应的资源。该响应必须返回一个Allow 头信息用以表示出当前资源能够接受的请求方法的列表。

鉴于 PUT,DELETE 方法会对服务器上的资源进行写操作,因而绝大部分的网页服务器都不支持或者在默认配置下不允许上述请求方法,对于此类请求均会返回405错误。

406 Not Acceptable

请求的资源的内容特性无法满足请求头中的条件,因而无法生成响应实体。

除非这是一个 HEAD 请求,否则该响应就应当返回一个包含可以让用户或者浏览器从中选择最合适的实体特性以及地址列表的实体。实体的格式由 Content-Type 头中定义的媒体类型决定。浏览器可以根据格式及自身能力自行作出最佳选择。但是,规范中并没有定义任何作出此类自动选择的标准。

407 Proxy Authentication Required

与401响应类似,只不过客户端必须在代理服务器上进行身份验证。代理服务器必须返回一个 Proxy-Authenticate 用以进行身份询问。客户端可以返回一个 Proxy-Authorization 信息头用以验证。参见RFC 2617。

408 Request Timeout

请求超时。客户端没有在服务器预备等待的时间内完成一个请求的发送。客户端可以随时再次提交这一请求而无需进行任何更改。

409 Conflict

由于和被请求的资源的当前状态之间存在冲突,请求无法完成。这个代码只允许用在这样的情况下才能被使用:用户被认为能够解决冲突,并且会重新提交新的请求。该响应应当包含足够的信息以便用户发现冲突的源头。

冲突通常发生于对 PUT 请求的处理中。例如,在采用版本检查的环境下,某次 PUT 提交的对特定资源的修改请求所附带的版本信息与之前的某个(第三方)请求向冲突,那么此时服务器就应该返回一个409错误,告知用户请求无法完成。此时,响应实体中很可能会包含两个冲突版本之间的差异比较,以便用户重新提交归并以后的新版本。

410 Gone

被请求的资源在服务器上已经不再可用,而且没有任何已知的转发地址。这样的状况应当被认为是永久性的。如果可能,拥有链接编辑功能的客户端应当在获得用户许可后删除所有指向这个地址的引用。如果服务器不知道或者无法确定这个状况是否是永久的,那么就应该使用404状态码。除非额外说明,否则这个响应是可缓存的。

410响应的目的主要是帮助网站管理员维护网站,通知用户该资源已经不再可用,并且服务器拥有者希望所有指向这个资源的远端连接也被删除。这类事件在限时、增值服务中很普遍。同样,410响应也被用于通知客户端在当前服务器站点上,原本属于某个个人的资源已经不再可用。当然,是否需要把所有永久不可用的资源标记为'410 Gone',以及是否需要保持此标记多长时间,完全取决于服务器拥有者。

411 Length Required

服务器拒绝在没有定义 Content-Length 头的情况下接受请求。在添加了表明请求消息体长度的有效 Content-Length 头之后,客户端可以再次提交该请求。

412 Precondition Failed

服务器在验证在请求的头字段中给出先决条件时,没能满足其中的一个或多个。这个状态码允许客户端在获取资源时在请求的元信息(请求头字段数据)中设置先决条件,以此避免该请求方法被应用到其希望的内容以外的资源上。

413 Request Entity Too Large

服务器拒绝处理当前请求,因为该请求提交的实体数据大小超过了服务器愿意或者能够处理的范围。此种情况下,服务器可以关闭连接以免客户端继续发送此请求。

如果这个状况是临时的,服务器应当返回一个 Retry-After 的响应头,以告知客户端可以在多少时间以后重新尝试。

414 Request-URI Too Long

请求的URI 长度超过了服务器能够解释的长度,因此服务器拒绝对该请求提供服务。这比较少见,通常的情况包括:

本应使用POST方法的表单提交变成了GET方法,导致查询字符串(Query String)过长。

重定向URI “黑洞”,例如每次重定向把旧的 URI 作为新的 URI 的一部分,导致在若干次重定向后 URI 超长。

客户端正在尝试利用某些服务器中存在的安全漏洞攻击服务器。这类服务器使用固定长度的缓冲读取或操作请求的 URI,当 GET 后的参数超过某个数值后,可能会产生缓冲区溢出,导致任意代码被执行[1]。没有此类漏洞的服务器,应当返回414状态码。

415 Unsupported Media Type

对于当前请求的方法和所请求的资源,请求中提交的实体并不是服务器中所支持的格式,因此请求被拒绝。

416 Requested Range Not Satisfiable

如果请求中包含了 Range 请求头,并且 Range 中指定的任何数据范围都与当前资源的可用范围不重合,同时请求中又没有定义 If-Range 请求头,那么服务器就应当返回416状态码。

假如 Range 使用的是字节范围,那么这种情况就是指请求指定的所有数据范围的首字节位置都超过了当前资源的长度。服务器也应当在返回416状态码的同时,包含一个 Content-Range 实体头,用以指明当前资源的长度。这个响应也被禁止使用 multipart/byteranges 作为其 Content-Type。

417 Expectation Failed

请求头 Expect 中指定的预期内容无法被服务器满足,或者这个服务器是一个代理服务器,它有明显的证据证明在当前路由的下一个节点上,Expect 的内容无法被满足。

421 There are too many connections from your internet address

从当前客户端所在的IP地址到服务器的连接数超过了服务器许可的最大范围。通常,这里的IP地址指的是从服务器上看到的客户端地址(比如用户的网关或者代理服务器地址)。在这种情况下,连接数的计算可能涉及到不止一个终端用户。

422 Unprocessable Entity

请求格式正确,但是由于含有语义错误,无法响应。(RFC 4918 WebDAV)

423 Locked

当前资源被锁定。(RFC 4918 WebDAV)

424 Failed Dependency

由于之前的某个请求发生的错误,导致当前请求失败,例如 PROPPATCH。(RFC 4918 WebDAV)

425 Unordered Collection

在WebDav Advanced Collections 草案中定义,但是未出现在《WebDAV 顺序集协议》(RFC 3658)中。

426 Upgrade Required

客户端应当切换到TLS/1.0。(RFC 2817)

449 Retry With

由微软扩展,代表请求应当在执行完适当的操作后进行重试。

5、服务器错误(5、6字头)

这类状态码代表了服务器在处理请求的过程中有错误或者异常状态发生,也有可能是服务器意识到以当前的软硬件资源无法完成对请求的处理。除非这是一个HEAD 请求,否则服务器应当包含一个解释当前错误状态以及这个状况是临时的还是永久的解释信息实体。浏览器应当向用户展示任何在当前响应中被包含的实体。

这些状态码适用于任何响应方法。

500 Internal Server Error

服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。一般来说,这个问题都会在服务器端的源代码出现错误时出现。

501 Not Implemented

服务器不支持当前请求所需要的某个功能。当服务器无法识别请求的方法,并且无法支持其对任何资源的请求。

502 Bad Gateway

作为网关或者代理工作的服务器尝试执行请求时,从上游服务器接收到无效的响应。

503 Service Unavailable

由于临时的服务器维护或者过载,服务器当前无法处理请求。这个状况是临时的,并且将在一段时间以后恢复。如果能够预计延迟时间,那么响应中可以包含一个 Retry-After 头用以标明这个延迟时间。如果没有给出这个 Retry-After 信息,那么客户端应当以处理500响应的方式处理它。

注意:503状态码的存在并不意味着服务器在过载的时候必须使用它。某些服务器只不过是希望拒绝客户端的连接。

504 Gateway Timeout

作为网关或者代理工作的服务器尝试执行请求时,未能及时从上游服务器(URI标识出的服务器,例如HTTP、FTP、LDAP)或者辅助服务器(例如DNS)收到响应。

注意:某些代理服务器在DNS查询超时时会返回400或者500错误

505 HTTP Version Not Supported

服务器不支持,或者拒绝支持在请求中使用的 HTTP 版本。这暗示着服务器不能或不愿使用与客户端相同的版本。响应中应当包含一个描述了为何版本不被支持以及服务器支持哪些协议的实体。

506 Variant Also Negotiates

由《透明内容协商协议》(RFC 2295)扩展,代表服务器存在内部配置错误:被请求的协商变元资源被配置为在透明内容协商中使用自己,因此在一个协商处理中不是一个合适的重点。

507 Insufficient Storage

服务器无法存储完成请求所必须的内容。这个状况被认为是临时的。WebDAV (RFC 4918)

509 Bandwidth Limit Exceeded

服务器达到带宽限制。这不是一个官方的状态码,但是仍被广泛使用。

510 Not Extended

获取资源所需要的策略并没有没满足。(RFC 2774)

600 Unparseable Response Headers

源站没有返回响应头部,只返回实体内容

声明:HTTP状态码,内容来源于百度百科

五、HTTP协议请求流程分析

HTTP协议分析

六、HTTP报文格式详解

1、HTTP请求发送消息报文格式

一次完整的http请求消息包括:一个请求行,若干消息头以及实体内容,而消息头和实体内容可以没有,消息头和实体内容之间有一个空行标识头部信息结束。

GET / HTTP/1.1                           //提交方法与HTTP协议版本

Host: www.crushlinux.com         //主机名

Connection: keep-alive               //是否保持连接

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8       //媒体类型

Upgrade-Insecure-Requests: 1                                                                                                //支持升级不安全请求,既是不适用http而是https

User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36  //客户端类型

Accept-Encoding: gzip, deflate, sdch                //网页支持压缩

Accept-Language: zh-CN,zh;q=0.8                  //语言类型

http://toolbar.netcraft.com/site_report?url=undefined#last_reboot

2、HTTP响应消息的格式

一个状态行、若干消息头和实体内容

HTTP/1.1 200 OK                                                     //HTTP协议版本与状态码

Date: Thu, 27 Oct 2016 15:50:23 GMT               //日期与时间

Server: Apache/2                                                    //服务器版本信息

X-Powered-By: PHP/5.6.21                                      //动态服务器版本信息

Content-Encoding: gzip                                            //传输压缩

Vary: Accept-Encoding,User-Agent

Keep-Alive: timeout=2, max=99                              //长连接时间

Connection: Keep-Alive                                           //支持长连接

Transfer-Encoding: chunked

Content-Type: text/html; charset=UTF-8             //媒体类型与字符集

[root@localhost ~]# curl -I http://www.crushlinux.com

HTTP/1.1 200 OK

Date: Thu, 27 Oct 2016 16:36:18 GMT

Server: Apache/2

X-Powered-By: PHP/5.6.21

Vary: Accept-Encoding,User-Agent

Content-Type: text/html; charset=UTF-8

七、DNS解析流程

以客户端访问www.baidu.com.为例:

1.  查找本地DNS缓存及hosts文件

2.  查找LDNS(local dns)服务器(缓存)

3.  查找根域服务器

4.  查找.com*域服务器

5.  LDNS请求.com服务器找到baidu.com服务器

6.  LDNS请求baidu.com服务器

7.  Baidu.com服务器返回www.baidu.com域名的IP解析记录给LDNS

8.  LDNS返回给给客户机解析记录及缓存到本地

[root@localhost ~]# dig +trace www.baidu.com

; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.30.rc1.el6 <<>> +trace www.baidu.com

;; global options: +cmd

.                           146276     IN     NS    b.root-servers.net.

.                           146276     IN     NS    g.root-servers.net.

.                           146276     IN     NS    l.root-servers.net.

.                           146276     IN     NS    d.root-servers.net.

.                           146276     IN     NS    m.root-servers.net.

.                           146276     IN     NS    k.root-servers.net.

.                           146276     IN     NS    f.root-servers.net.

.                           146276     IN     NS    h.root-servers.net.

.                           146276     IN     NS    j.root-servers.net.

.                           146276     IN     NS    e.root-servers.net.

.                           146276     IN     NS    a.root-servers.net.

.                           146276     IN     NS    i.root-servers.net.

.                           146276     IN     NS    c.root-servers.net.

;; Received 508 bytes from 202.106.0.20#53(202.106.0.20) in 65 ms

#a-m共13台根域DNS服务器,b.root-servers.net.负责了本次解析

com.                            172800     IN     NS    a.gtld-servers.net.

com.                            172800     IN     NS    b.gtld-servers.net.

com.                            172800     IN     NS    c.gtld-servers.net.

com.                            172800     IN     NS    d.gtld-servers.net.

com.                            172800     IN     NS    e.gtld-servers.net.

com.                            172800     IN     NS    f.gtld-servers.net.

com.                            172800     IN     NS    g.gtld-servers.net.

com.                            172800     IN     NS    h.gtld-servers.net.

com.                            172800     IN     NS    i.gtld-servers.net.

com.                            172800     IN     NS    j.gtld-servers.net.

com.                            172800     IN     NS    k.gtld-servers.net.

com.                            172800     IN     NS    l.gtld-servers.net.

com.                            172800     IN     NS    m.gtld-servers.net.

;; Received 491 bytes from 193.0.14.129#53(193.0.14.129) in 296 ms

#解析com*域的共有13台DNS服务器,a.gtld-servers.net.负责了本次解析

baidu.com.               172800     IN     NS    dns.baidu.com.

baidu.com.               172800     IN     NS    ns2.baidu.com.

baidu.com.               172800     IN     NS    ns3.baidu.com.

baidu.com.               172800     IN     NS    ns4.baidu.com.

baidu.com.               172800     IN     NS    ns7.baidu.com.

;; Received 201 bytes from 192.31.80.30#53(192.31.80.30) in 144 ms

#解析baidu.com的有5台服务器,dns.baidu.com. 负责了本次解析

www.baidu.com.             1200         IN     CNAME    www.a.shifen.com.

a.shifen.com.           1200         IN     NS    ns2.a.shifen.com.

a.shifen.com.           1200         IN     NS    ns1.a.shifen.com.

a.shifen.com.           1200         IN     NS    ns5.a.shifen.com.

a.shifen.com.           1200         IN     NS    ns3.a.shifen.com.

a.shifen.com.           1200         IN     NS    ns4.a.shifen.com.

;; Received 228 bytes from 119.75.219.82#53(119.75.219.82) in 186 ms