HTTP协议简介、工作原理、请求方法、请求/响应步骤、Request/Response示例

时间:2022-12-18 19:57:19

HTTP简单介绍

HTTP是超文本传输协议,定义了客户端与服务器端之间文本传输的规范。

HTTP默认使用80端口,这个端口指的是服务端的端口,而客户端使用的端口是动态分配的。

当我们没有指定端口访问时,浏览器会默认帮我们添加80端口。可以自己指定端口,如:

http://www.51cto.com:80

会自动跳转到:https

https://www.51cto.com

注意:现在大多数访问都使用了HTTPS协议,而HTTPS的默认端口是443,如果使用80端口HTTPS协议的服务器可能会被拒绝。

提示:一般WEB服务器会将80端口重写向到443端口,也就是http访问自动跳转到https,来达到强制使用SSL证书加密。

HTTP协议简介、工作原理、请求方法、请求/响应步骤、Request/Response示例


HTTP请求方法

HTTP1.0定义了三种请求方法:GET、POST和HEAD方法。

HTTP1.1新增了五种请求方法:OPTIONS、PUT、DELETE、TRACE和CONNECT方法。

HTTP协议简介、工作原理、请求方法、请求/响应步骤、Request/Response示例

1、GET

向特定的资源发出请求。

注意:GET方法不应当被用于产生“副作用”的操作中,例如在 Web Application 中,其中一个原因是 GET 可能会被网络蜘蛛等随意访问。

2、HEAD

向服务索取与GET请求相一致的响应,只不过响应体将不会被返回。

这一方法可以再不必传输整个响应内容的情况下,就可以获取包含在响应消息头中的元信息。

3、POST

向指定资源提交数据进行处理请求,如:提交表单或者上传文件。

数据被包含在请求体中,POST请求可能会导致新的资源的建立和/或已有资源的修改。

4、PUT

向指定资源位置上传其最新内容。

5、DELETE

请求服务器删除 Request-URL 所标识的资源。

6、TRACE

回显服务器收到的请求,主要用于测试或诊断。

7、OPTIONS

返回服务器针对特定资源所支持的HTTP请求方法,也可以利用向WEB服务器发送“*”的请求来测试服务器的功能性。

在跨域的情况下,浏览器发起"复杂请求"时会主动发起 OPTIONS 请求。

跨域共享标准规范要求,对那些可能对服务器数据产生副作用的 HTTP 请求方法(特别是 GET 以外的 HTTP 请求,或者搭配某些 MIME 类型的 POST 请求),浏览器必须首先使用 OPTIONS 方法发起一个预检请求(preflight request),从而获知服务端是否允许该跨域请求。服务器确认允许之后,才发起实际的 HTTP 请求。

8、CONNECT

HTTP/1.1协议中预留给能够将连接改为管理方式的代理服务器。

注意:

1)方法名称是区分大小写的,当某个请求所针对的资源不支持对应的请求方法的时候,服务器应当返回状态码405(Mothod Not Allowed);当服务器不认识或者不支持对应的请求方法时,应返回状态码 501(Not Implemented)。

2)HTTP服务器至少应该实现 GET 和 HEAD/POST 方法,其他方法都是可选的,此外除上述方法,特定的 HTTP 服务支持扩展自定义的方法。


HTTP工作原理

HTTP协议定义 WEB 客户端如何从 WEB 服务器请求 WEB 页面,以及服务器如何把 WEB 页面传送给客户端。HTTP 协议采用了请求/响应模型。

客户端向服务器发送一个请求报文,请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。

服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或错误代码、服务器信息、响应头部和响应数据。


HTTP请求/响应步骤

客户端连接到WEB服务器 -> 发送HTTP请求 -> 服务器接受请求并返回HTTP响应 -> 释放连接TCP连接 -> 客户端浏览器解析HTML内容。

1、客户端连到WEB服务器

一个HTTP客户端,通常是浏览器,与WEB服务器的HTTP端口(默认80)建立一个TCP套接字连接,例如:

http://www.51cto.com:80

2、发送HTTP请求

通过TCP套接字,客户端向WEB服务器发送一个文本的请求报文,一个请求报文由:请求行请求头部空行请求数据这四部分组成。

3、服务器接受请求并返回HTTP响应

WEB服务器解析请求,定位请求资源。服务器将资源副本写到TCP套接字,由客户端读取。

一个响应由:状态行响应头部空行响应数据四部分组成。

4、释放TCP连接

若 Connection 模式为 Close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放 TCP 连接;

若 Connection 模式为 Keepalive,则该连接会保持一段时间,在该时间内容可以继续接收请求;

5、客户端浏览器解析HTML内容

客户端浏览器首先解析状态行,查看表明请求是否成功的状态码。然后解析每一个响应头,响应头告知以下为若干字节的 HTML 文档和文档的字符集。

客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。


HTTP请求消息Request

客户端发送一个HTTP请求到服务器,这个请求消息包括:

请求行请求头部空行请求数据四个部分。

HTTP协议简介、工作原理、请求方法、请求/响应步骤、Request/Response示例

请求行以一个方法符号开头,以空格分开,后面跟着请求的URI和协议的版本

GET 请求示例:使用Charles抓取的request;

GET /562f25980001b1b106000338.jpg HTTP/1.1
Host img.mukewang.com
User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept image/webp,image/*,*/*;q=0.8
Referer http://www.imooc.com/
Accept-Encoding gzip, deflate, sdch
Accept-Language zh-CN,zh;q=0.8

第一部分:请求行,用来说明请求方法,要访问的资源以及所使用的HTTP版本.

请求方法:GET,说明请求类型为GET

请问路径:[/562f25980001b1b106000338.jpg]为要访问的资源

协议版本:HTTP1.1版本。


第二部分:请求头部,紧接着请求行(从第二行起)之后的部分,用来说明服务器要使用的附加信息。

从第二行起为请求头部:

HOST:将指出请求的目的地。

User-Agent:服务器端和客户端脚本都能访问它,它是浏览器类型检测逻辑的重要基础.该信息由你的浏览器来定义,并且在每个请求中自动发送等等


第三部分:空行,请求头部后面的空行是必须的,示例中看不出来;

即使第四部分的请求数据为空,也必须有空行。

第四部分:请求数据也叫主体,可以添加任意的其他数据。

这个例子的请求数据为空。


POST请求示例:使用Charles抓取的 request;

POST / HTTP1.1
Host:www.wrox.com
User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
Content-Type:application/x-www-form-urlencoded
Content-Length:40
Connection: Keep-Alive

name=Professional%20Ajax&publisher=Wiley

第一部分:请求行,请求方法是post,请求路径是/,协议版本是http1.1。

第二部分:请求头部,第2行至第6行。

第三部分:空行,第7行的空行,必须。

第四部分:请求数据,第8行,使用"&"相连。


HTTP响应消息Response

一般情况下,服务器接收并处理客户端发过来的请求后会返回一个HTTP的响应消息。

HTTP响应也由四个部分组成:状态行消息报头空行响应正文。

HTTP协议简介、工作原理、请求方法、请求/响应步骤、Request/Response示例

HTTP/1.1 200 OK
Date: Fri, 22 May 2009 06:07:21 GMT
Content-Type: text/html; charset=UTF-8

<html>
<head></head>
<body>
<!--body goes here-->
</body>
</html>

第一部分:状态行,由HTTP协议版本号、状态码状态消息三部分组成。

第一行为状态行

协议版本:HTTP/1.1

状态码:200

状态消息:ok

第二部分:消息报头,用来说明客户端要使用的一些附加信息。

第二行和第三行为消息报头

Date:生成响应的日期和时间;

Content-Type:指定了MIME类型的HTML(text/html),编码类型是UTF-8。


第三部分:空行,消息报头后面的空行是必须的。

第四部分:响应正文,服务器返回给客户端的文本信息。

空行后面的html部分为响应正文。


响应状态码(常见的)

200 OK  当您的操作将在响应正文中返回数据时,出现此结果。

204 No Content 当您的操作成功,但不在响应正文中返回数据时,出现此结果。

304 Not Modified(重定向)  当测试实体自上次检索以来是否被修改时,出现此结果。

403 Forbidden   客户端错误

401 Unauthorized 客户端错误

413 Payload Too Large(客户端错误) 当请求长度过长时,出现此结果。

400 BadRequest(客户端错误) 当参数无效时,出现此结果。

404 Not Found(客户端错误) 当资源不存在时,出现此结果。

405 Method Not Allowed(客户端错误)由于方法和资源组合不正确而出现此错误。 例如,您不能对一个实体集合使用 DELETE 或 PATCH。

412 Precondition Failed  客户端错误

501 Not Implemented(服务器错误) 当未实施某个请求的操作时,出现此结果。

503 Service Unavailable(服务器错误) 当 Web API 服务不可用时,出现此结果。


GET与POST比较

GET方法提交的数据会直接填充在请求报文件的URL上:

https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1

"?"​​问号划分域名和GET提交的参数,格式为:​A=a&B=b&C=c​;

其中A是参数名,B是参数值,多个参数之间用&进行分割,如果参数值是中文,则会转换成诸如%ab%12加密16进制码。一般来说,浏览器处理的URL最大限度长度为1024B(不同浏览器不一样),所以GET方法提交参数长度有限制。

POST方法提交的数据会附在正文上,一般请求正文的长度是没有限制的,但表单中所能处理的长度一般为100k(不同协议不同浏览器不一样),而且需要考虑下层报文的传输效率,不推荐过长。

所以GET方法可以用来传输一些可以公开的参数信息,解析也比较方便,如百度的搜索的关键词,而POST方法可以用来提交一个用户的敏感信息(如果不使用HTTPS加密,报文正文仍旧是明文,可能被人截获读取)。

HTTP协议简介、工作原理、请求方法、请求/响应步骤、Request/Response示例

HTTP主要特点

1、无连接

无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

2、无状态

HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

3、简单快速

客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。

4、灵活

HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。

5、支持B/S及C/S模式