处理表单(POST)
用METHOD=”POST”指定表单按POST方式提交,数据将通过标准输入流stdin的方式传入脚本,POST提交的数据是没有结束符EOF的,所以其长度由环境变量CONTENT_LENGTH指定,不要试图读取超过CONTENT_LENGTH的长度。在将这个例子之前有必要好好介绍一下C语言中的一个输入函数:int sscanf(string str,string fmt,mixed var1,mixed var2 …)
这个函数用来从一个字符串中读进与指定格式相符的数据。此函数与int scanf(const char *format[,argument])类似,只是scanf用来以键盘(stdin)为输入源,而sscanf以固定字符串为输入源,其返回值为按正确格式输入的变量的个数。
参考百度百科——SSCANF
其中的format可以是一个或多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符号}
注:
1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)
2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。
3、width表示读取宽度。
4、{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。
5、type :这就很多了,就是%s,%d之类。
6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值
支持集合操作:
%[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)
%[aB'] 匹配a、B、'中一员,贪婪性
%[^a] 匹配非a的任意字符,贪婪性
1. 常见用法。
char buf[512] = ;
sscanf("123456 ", "%s", buf);
printf("%s\n", buf);
结果为:123456
2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。
sscanf("123456 ", "%4s", buf);
printf("%s\n", buf);
结果为:1234
3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。
sscanf("123456 abcdedf", "%[^ ]", buf);
printf("%s\n", buf);
结果为:123456
4. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。
sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);
printf("%s\n", buf);
结果为:123456abcdedf
5. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。
sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);
printf("%s\n", buf);
结果为:123456abcdedf
6、给定一个字符串iios/12DDWDFF@122,获取 / 和 @ 之间的字符串,先将 "iios/"过滤掉,再将非'@'的一串内容送到buf中
sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
printf("%s\n", buf);
结果为:12DDWDFF
7、给定一个字符串““hello, world”,仅保留world。(注意:“,”之后有一空格)
sscanf(“hello, world”, "%*s%s", buf);
printf("%s\n", buf);
结果为:world
%*s表示第一个匹配到的%s被过滤掉,即hello被过滤了
如果没有空格则结果为NULL。
sscanf的功能很类似于正则表达式, 但却没有正则表达式强大,所以如果对于比较复杂的字符串处理,建议使用正则表达式.
//-------------------------------------------------------
sscanf,表示从字符串中格式化输入
上面表示从str中,输入数字给x,就是32700
久以前,我以为c没有自己的split string函数,后来我发现了sscanf;一直以来,我以为sscanf只能以空格来界定字符串,现在我发现我错了。
sscanf是一个运行时函数,原形很简单:
int sscanf(
const char *buffer,
const char *format [,
argument ] ...
);
它强大的功能体现在对format的支持上。
我以前用它来分隔类似这样的字符串2006:03:18:
int a, b, c;
sscanf("2006:03:18", "%d:%d:%d", a, b, c);
以及2006:03:18 - 2006:04:18:
char sztime1[16] = "", sztime2[16] = "";
sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2);
但是后来,我需要处理2006:03:18-2006:04:18
仅仅是取消了‘-’两边的空格,却打破了%s对字符串的界定。
我需要重新设计一个函数来处理这样的情况?这并不复杂,但是,为了使所有的代码都有统一的风格,我需要改动很多地方,把已有的sscanf替换成我自己的分割函数。我以为我肯定需要这样做,并伴随着对sscanf的强烈不满而入睡;一觉醒来,发现其实不必。
format-type中有%[]这样的type field。如果读取的字符串,不是以空格来分隔的话,就可以使用%[]。
%[]类似于一个正则表达式。[a-z]表示读取a-z的所有字符,[^a-z]表示读取除a-z以外的所有字符。
所以那个问题也就迎刃而解了:
sscanf("2006:03:18 - 2006:04:18", "%[0-9,:] - %[0-9,:]", sztime1, sztime2);
关于格式字符:
%d 从键盘输入十进制整数
%o 从键盘输入八进制整数
%x 从键盘输入十六进制整数
%c 从键盘输入一个字符
%s 从键盘输入一个字符串
%f 从键盘输入一个实数
%e 与%f的作用相同
1、修改multiple.html加入代码,添加一个POST提交的表单
<from action="http://192.168.44.128/cgi-bin/mult.cgi">
<div><label>Multiplicand 1: <input name="m" size="5"></label></div>
<div><label>Multiplicand 2: <input name="n" size="5"></label></div>
<div><input type="submit" value="Multiply!"></div>
</form>
<form action="http://192.168.44.128/cgi-bin/ collect.cgi"
method="POST">
<div><label for="data">Your input</label> (80 chars max.):</div>
<div><input id="data" name="data" size="60" maxlength="80"></div>
<div><input type="submit" value="Send"></div>
</form>
1、 新建文件collect.c
#vim collect.c
#include <stdio.h>
#include <stdlib.h>
#define MAXLEN 80
#define EXTRA 5
/* 4 for field name "data", 1 for "=" */
#define MAXINPUT MAXLEN+EXTRA+2
/* 1 for added line break, 1 for trailing NUL */
#define DATAFILE "../data/data.txt"
void unencode(char *src, char *last, char *dest)
{
//对URL编码数据进行解码URL数据会以data=xxx的形式编码
//URL编码和ASCII值的对应关系可以看这里
// http://www.zhongguosou.com/html/html_urlencode.html
for(; src != last; src++, dest++)
if(*src == '+')
*dest = ' ';
//遇到+转化为空格
else if(*src == '%') {
int code;
if(sscanf(src+1, "%2x", &code) != 1) code = '?';
*dest = code;
/*如果发现以%开头的,则为特殊字符的编码,检查%后的两位十六进制是否是特殊符号编码,如果是则将取符号的ASCII值,比如!被编码为%21,其ASCII值为21,dest中将保存值21*/
src +=2; }
else
*dest = *src;
//非特殊字符直接保存
*dest = '\n';
*++dest = '\0';
//最后加上换行和字符串结束符
}
int main(void)
{
char *lenstr;
char input[MAXINPUT], data[MAXINPUT];
long len;
printf("%s%c%c\n",
"Content-Type:text/html;charset=iso-8859-1",13,10);
printf("<TITLE>Response</TITLE>\n");
lenstr = getenv("CONTENT_LENGTH");
if(lenstr == NULL || sscanf(lenstr,"%ld",&len)!=1 || len > MAXLEN)
printf("<P>Error in invocation - wrong FORM probably.");
else {
FILE *f;
fgets(input, len+1, stdin);
/*fetts从指定输入流读取字符串,原型为:char *fgets(char *s,int n,FILE *stream)从stream读入字符串到s中,当读入n-1个字符或换行符时,函数停止操作,改函数在s的末尾增加一个NULL字符表明串的结束.成功返回指向s的指针,遇到文件结束或出错返回EOF*/
unencode(input+EXTRA, input+len, data);
f = fopen(DATAFILE, "a");
/*以追加方式打开文件, r 打开只读文件,该文件必须存在。
r+ 打开可读写的文件,该文件必须存在。
w 打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。
w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。
a 以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。
a+ 以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。
上述的形态字符串都可以再加一个b字符,如rb、w+b或ab+等组合,加入b 字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。不过在POSIX系统,包含Linux都会忽略该字符。*/
if(f == NULL)
printf("<P>Sorry, cannot store your data.");
else
fputs(data, f);
/*将字符串data写入文件f中,fputs函数的功能是向指定的输出流拷贝一个以NULL为结束符的字符串*/,
fclose(f);
printf("<P>Thank you! Your contribution has been stored.");
}
return 0;
}
#gcc –o collect.cgi collect.c
#mv collect.cgi /var/www/cgi-bin/
2、 在浏览器中输入:192.168.44.128/html/multiple.html
页面上出现了我们刚才增加的一个输入框,在输入框中输入一段文字,点击提交按钮,文字就被保存到文件中了。
呵呵上面的C源文件其实是有一点点小问题的,就是规范上的问题,当然对于这点小问题来说Apache等高级的服务器是忽略的,但是对于即优秀又弱智的boa来说可就不会给你好好工作了呵呵!用boa的朋友们会发现运行以后会出现502错误!呵呵好好分析一下,网上给出了最普通的原因为权限和lib库问题,还有一个原因就是HTML写的不标准呵呵