在文章还未进入正题的时候,我就HTTP协议这个东西给大家再罗嗦两句。其实关于HTTP协议这个东西我本来都不想说的。但是,为了照顾大多数朋友。平日里,当我们在打开一个网站的时候,比如说 http://www.2345.com/,实际上IE作为一个客户端,它将向服务器发送的是如下的请求报文:
GET / HTTP/1.1 Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms- powerpoint, application/vnd.ms-excel, application/msword, application/x-shockwave-flash, */* Accept-Language: zh-cn Accept-Encoding: gzip, deflate User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0) Host: www.2345.com Connection: Keep-Alive Cookie: NETEASE_SSN=hinrof; NETEASE_ADV=11&22; Province=0; City=0; NTES_UV_COOKIE=YES |
从以上的报文中,我们可以看到很多字段,不过其中有很多并不是必须的,如果我们自己编程,只关心必要的就行了。在HTTP/1.1协议中规定了最小请求消息由方法字段(GET/POST/HEAD)和主机字段(HOST)构成。如上面的
GET /HTTP/1.1 HOST:www.2345.com |
但在HTTP/1.0中,HOST字段并不是必须的,至于这里为什么不能省,继续往下看。
GET和POST是浏览器向服务器提交报文通常所采用的两种方法。服务器在收到报文之后,解码分析出所需的数据并进行处理,最后返回结果。通常我们可以看到的都是像http://***.***.***.***/list.asp?id=***这样的URL请求,我们可以自己构造如下的报文来完成 。
GET /list.asp?id=*** HTTP/1.1 HOST:***.***.***.*** |
由于受URL长度1024的限制,所以GET方法通常是用在提交一些小数据的情况下。如果数据比较大就只能采用POST方法。在讲解POST方法的一些要点之前,大家还是先来看一段POST请求报文。
POST /huace/add.php HTTP/1.1 Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms- powerpoint, application/vnd.ms-excel, application/msword, application/x-shockwav e-flash, */* Referer: http://202.147.125.36/huace/add.php Accept-Language: zh-cn Content-Type: application/x-www-form-urlencoded Accept-Encoding: gzip, deflate User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0) Host: 202.147.125.36 Content-Length: 115 Connection: Keep-Alive name=test&email=&comefrom=&homepage=&icq= |
POST /huace/add.php HTTP/1.1 Host: 202.147.125.36 Content-Type: application/x-www-form-urlencoded Content-Length: 115 name=test&email=&comefrom=&homepage= &icq=&oicq=&image=say.gif&comment=test&password=&doadd=%B7%A2%CB%CD%C1%F4%D1%D4 |
上面的Content-Type字段表示为POST表单型的,Content-Length当然就是表示实体数据的长度了,这里都不能少,不然就无法正确接收了。这样,服务器端处理页面就会收到提交的数据,并接收处理。
上面不知不觉的讲了一大堆关于客户端的东西,接下来看服务器方面。当报文数据到达服务器后,服务器底层进程进行接收并放入特定的缓冲区,同时设置一些环境变量,如“CONTENT_LENGTH“、”QUERY_STRING“等,当然这其间还是屏蔽了一些底层细节的,如客户端提交的数据是怎么被重置到被请求页的标准输入的,在此我们就不做过多的考虑。之后高层应用程序如CGI、ASP、PHP等对其进行数据提取,其中CGI还须自己进行Unencode解码和字符串提取。假如向一个ASP程序提交数据,我提交了name和body字段,且采用POST表单方式提交,在ASP程序中应如下进行接收:
name=request.form("name") body=request.form("body") 并添加到数据库中 rs.addnew rs("name")=name rs("body")=body rs.update |
int isT(char ch) { if(ch==’ ’||ch==’%’||ch==’/’||ch&0x80) return 1; else return 0; } int encode(char *s,char *d) |
int unencode(char *s,char *d) { if(!s||!d) return 0; for(;*s!=0;s++) { if(*s==’+’) { *d=’ ’; d++; } else if(*s==’%’) { int code; if(sscanf(s+1,"%02x",&code)!=1) code=’?’; *d=code; s+=2; d++; } else { *d=*s; d++; } } *d=0; return 1; } …… |