HTTP协议(4)

HTTP 概括总结方便以后使用、遗忘时有侧重点的去学习，方便查阅：

开始看到webservice 和restful 有些不理解现在可以简单理解为：

webservice = http协议+XML

REST = http协议+json

通过这篇文章：http://www.cnblogs.com/zswordsman/p/5782152.html 对互联网数据传输所需要的条件有了一定的认识（主机+端口）。

（一）HTTP请求信息和响应信息的格式

请求
1. 请求行 ---> 请求方法请求路径所用的协议
2. 请求头信息
3. 请求主体信息

请求方法：有GET POST PUT DELETE TRACE OPTIONS HEAD

GET用来获取资源，POST用来新建资源（也可以用于更新资源），PUT用来更新资源，DELETE用来删除资源。

参阅：http://www.ruanyifeng.com/blog/2011/09/restful 来理解下RESTful架构

参阅：http://pan.baidu.com/s/1qXT0ATm来理解下webservice

目前有些框架对RESTful 架构有很好的支持如Yii2.x版本。

HEAD与GET的功能基本一致但是不返回内容，可以用来确认内容是否还正常存在。

TRACE：比如你用代理上网不放心代理是否篡改了你的信息，用TRACE来测试，服务器就会把最后收到的内容返回给你。

OPTIONS：返回服务器可用的请求方法。（上述方法虽然是HTTP协议规定的方法，但是WEB SERVICE 未必允许或支持这些方法。）

请求头信息包含的很多

host：请求的域名，必须要有

accept-encoding：可以接受的编码类型（不是字符编码，指的是文件格式），如果没有该头信息，说明浏览器可以接收任何类型

referer：引用，当前请求是从哪个请求过来的

connection：连接方式，1.0版本close，1.1版本keep-alive

accept-language：可以接收的语言类型，zh-CN代表中文，如果没有该选项，那么代表浏览器可以接收任何语言类型

cookie：服务器保存在浏览器的数据，浏览器提供了一个功能能够保存数据，服务器借助于浏览器的该能力，将数据保存在浏览器端

user-agent：浏览器的信息

HTTP协议(4)

accept：浏览器可以接收的文件类型，如果没有指定，代表可以接收任何类型的数据

HTTP协议(4)

content-length：post请求时，浏览器给服务器发送是数据的长度，单位是字节

if-modified-since：get方式，会在本地产生一个缓存文件，去判断缓存时间和服务器文件修改时间

content-type：post向服务器提交数据的数据类型，比如说文件上传时候的enctype

需要注意如果发送信息则对信息的格式和信息的长度要有规定

请求头和请求主题信息之间要有一个空行来说明头信息结束接下来为主体信息

2. 响应

响应行 --------> 协议状态码状态文字
响应头信息
响应主体信息

响应头信息和响应主体信息之间也有空行当然响应主体信息也可能不存在

状态码参考：http://note.youdao.com/yws/public/redirect/share?id=b3fb3998f4a02abbd5a7c35e4f7dd8fc&type=false

301/302 ：永久/临时重定向

如果在重定向过程中要保留之前的传输的数据可以用307如header(‘要重定向的路径’,true，307);

常用的响应头信息

server：服务器信息

date：服务器响应的时间

last-modified：当前请求文件最后被修改的时间

content-length：响应体的数据长度，单位是字节

content-type：响应体的类型

location：重定向

refresh：刷新，包含时间和指定的url

content-encodeing：响应文件的编码（不是字符集，是格式）

cache-control：缓存控制，no-cache，不使用缓存、

keep-alive：保持连接，timeout表示超时时间，Max表示系统会自动判断连接次数，所以当一个浏览器向网站发出请求最长能够timeout*max的时间内

=============================================================================

下面是一些应用

PHP模拟响应

1. 设置浏览器解析的字符集编码

header(‘Content-type:text/html;charset=utf-8’);

2. 跳转

header(‘Location:url’);

demo02_location.php

HTTP协议(4)

请求demo02_location.php的响应

HTTP协议(4)

httpwatch效果

HTTP协议(4)

3. 刷新

header(‘Refresh:time,url’)

demo03_refresh.php

HTTP协议(4)

demo03_refresh.php的响应

HTTP协议(4)

刷新到其他界面

HTTP协议(4)

refresh和location的区别

1. location是立即跳转，不会等到页面显示数据，就立马跳转。浏览器在解析HTTP协议的时候，碰到了location，就会马上组织HTTP协议进行二次请求

2. refresh是在浏览器端先休息一定时间之后，再跳转。浏览器解析HTTP协议的时候，碰到了refresh，发现需要停留一定时间，再组织HTTP协议进行二次请求

3. refresh能够将脚本内的其他内容进行先输出后跳转，而location不能显示脚本内的其他数据。

4. 发送图片

header(‘Content-type:image/jpg’);

demo04_image.php

HTTP协议(4)

demo04_image.php的响应及效果

HTTP协议(4)

注意：content-type：image/图片类型，该图片类型要与本身图片的类型一致。不同的浏览器在识别jpg等图片的时候，需要做成jpeg

5. 文件下载

header(‘Content-type:application/octet-stream’)

header(‘content-disposition:attachment;filename’)

demo05_download.php

HTTP协议(4)

demo05_download.php的响应

HTTP协议(4)

效果是以附件的形式来保存响应的东西。

PHP模拟HTTP请求

1. PHP能够与Apache进行连接

fsockopen($domainname,$port,$errno,$errinfo,$timeout)：连接Apache，发出一个请求，得到一个请求资源，得到一个连接资源

HTTP协议(4)

2. PHP模拟发送HTTP请求

fwrite($handle,$string)：向一个资源中写入指定内容

HTTP协议(4)

3. 获得响应，就是通过fsockopen这个连接来获得响应

fgets()：从一个资源中获取一行或者指定长度数据

HTTP协议(4)

4. 输出全部数据

HTTP协议(4)

效果

HTTP协议(4)

========================================================================

另外利用HTTP协议还可以进行socket编程，模拟登陆发帖等操作。

（二）关于防盗链

请求头的Referer信息 :可以标记从哪里来

一般通过配置apache服务器来防盗链：

打开apache的重写模块：mod_rewrite
在需要防盗链的网站目录下写.htaccess文件，并制定防盗链规则

另外也可在PHP中做处理但是不推荐

反防盗链的话那就是去伪造Referer了。

（三）关于缓存

缓存是个大话题，目前只是做一下了解待深入研究

我们可以在服务器端开启缓存模块同时设置缓存的文件类型和缓存的缓存的时长

也可以做信息的过滤对某些信息不缓存

我们都知道3xx表示重定向，其中缓存也是运用到这一点符合条件服务器返回304 重定向让浏览器去缓存取

浏览器缓存机制可参考文章：http://www.cnblogs.com/skynet/archive/2012/11/28/2792503.html

http://www.cnblogs.com/lyzg/p/5125934.html，

http://www.cnblogs.com/futan/archive/2013/04/21/cachehuancun.html

http://www.imooc.com/article/1478。

（四）关于HTTP压缩

在服务器端开启压缩功能

如default或者gzip模块

同时在conf文件中写下一些代码

<ifmodule mod_deflate.c>

DeflateCompressionLevel  6 # 压缩级别为6   可选1-9

AddOutputFilterByType DEFLATE text/plain #  压缩文本文件

AddOutputFilterByType DEFLATE text/html #  压缩html文件

AddOutputFilterByType DEFLATE text/xml #  压缩xml

<ifmodule>

为什么要指定压缩的文件类型？

因为压缩也要消耗cpu资源，所以一般情况下压缩文本型的比较多，而图片视频等不压缩。

以上只是对HTTP的一个基本认识，做个笔记，写的比较乱 HTTP协议(4) .

想更深入的学习可以参考--HTTP权威指南：http://pan.baidu.com/s/1c16i3Os

（一）HTTP请求信息和响应信息的格式

请求

2. 响应

1. 设置浏览器解析的字符集编码

2. 跳转

3. 刷新

4. 发送图片

5. 文件下载

（二）关于防盗链

（四）关于HTTP压缩

相关文章