嵌入式CGI开发之旅——4

时间:2020-12-17 21:04:41
表单提交有两种方式前面讲了GET方式,还有一种POST方式。POST方式不受提交数据大小的限制,而且不会在URL中显示出提交的内容
 

处理表单(POST)


         用METHOD=”POST”指定表单按POST方式提交,数据将通过标准输入流stdin的方式传入脚本,POST提交的数据是没有结束符EOF的,所以其长度由环境变量CONTENT_LENGTH指定,不要试图读取超过CONTENT_LENGTH的长度。在将这个例子之前有必要好好介绍一下C语言中的一个输入函数:int sscanf(string str,string fmt,mixed var1,mixed var2 …)


这个函数用来从一个字符串中读进与指定格式相符的数据。此函数与int scanf(const char *format[,argument])类似,只是scanf用来以键盘(stdin)为输入源,而sscanf以固定字符串为输入源,其返回值为按正确格式输入的变量的个数。


参考百度百科——SSCANF


其中的format可以是一个或多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符号}


  注:


  1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)


  2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。


  3、width表示读取宽度。


  4、{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。


  5、type :这就很多了,就是%s,%d之类。


  6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值


  支持集合操作:


  %[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)


  %[aB'] 匹配a、B、'中一员,贪婪性


%[^a] 匹配非a的任意字符,贪婪性


  1. 常见用法。


  char buf[512] = ;


  sscanf("123456 ", "%s", buf);


  printf("%s\n", buf);


  结果为:123456


  2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。


  sscanf("123456 ", "%4s", buf);


  printf("%s\n", buf);


  结果为:1234


  3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。


  sscanf("123456 abcdedf", "%[^ ]", buf);


  printf("%s\n", buf);


  结果为:123456


  4. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。


sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);


  printf("%s\n", buf);


  结果为:123456abcdedf


  5. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。


  sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);


  printf("%s\n", buf);


  结果为:123456abcdedf


  6、给定一个字符串iios/12DDWDFF@122,获取 / 和 @ 之间的字符串,先将 "iios/"过滤掉,再将非'@'的一串内容送到buf中


  sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);


  printf("%s\n", buf);


  结果为:12DDWDFF


  7、给定一个字符串““hello, world”,仅保留world。(注意:“,”之后有一空格)


  sscanf(“hello, world”, "%*s%s", buf);


  printf("%s\n", buf);


  结果为:world


  %*s表示第一个匹配到的%s被过滤掉,即hello被过滤了


  如果没有空格则结果为NULL。


  sscanf的功能很类似于正则表达式, 但却没有正则表达式强大,所以如果对于比较复杂的字符串处理,建议使用正则表达式.


  //-------------------------------------------------------


  sscanf,表示从字符串中格式化输入


  上面表示从str中,输入数字给x,就是32700


  久以前,我以为c没有自己的split string函数,后来我发现了sscanf;一直以来,我以为sscanf只能以空格来界定字符串,现在我发现我错了。


  sscanf是一个运行时函数,原形很简单:


  int sscanf(


  const char *buffer,


  const char *format [,


  argument ] ...


  );


  它强大的功能体现在对format的支持上。


  我以前用它来分隔类似这样的字符串2006:03:18:


  int a, b, c;


  sscanf("2006:03:18", "%d:%d:%d", a, b, c);


  以及2006:03:18 - 2006:04:18:


  char sztime1[16] = "", sztime2[16] = "";


  sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2);


  但是后来,我需要处理2006:03:18-2006:04:18


  仅仅是取消了‘-’两边的空格,却打破了%s对字符串的界定。


  我需要重新设计一个函数来处理这样的情况?这并不复杂,但是,为了使所有的代码都有统一的风格,我需要改动很多地方,把已有的sscanf替换成我自己的分割函数。我以为我肯定需要这样做,并伴随着对sscanf的强烈不满而入睡;一觉醒来,发现其实不必。


  format-type中有%[]这样的type field。如果读取的字符串,不是以空格来分隔的话,就可以使用%[]。


  %[]类似于一个正则表达式。[a-z]表示读取a-z的所有字符,[^a-z]表示读取除a-z以外的所有字符。


  所以那个问题也就迎刃而解了:


  sscanf("2006:03:18 - 2006:04:18", "%[0-9,:] - %[0-9,:]", sztime1, sztime2);


关于格式字符:


%d  从键盘输入十进制整数


%o  从键盘输入八进制整数


%x  从键盘输入十六进制整数


%c  从键盘输入一个字符


%s  从键盘输入一个字符串


%f  从键盘输入一个实数


%e  与%f的作用相同


         1、修改multiple.html加入代码,添加一个POST提交的表单


<from action="http://192.168.44.128/cgi-bin/mult.cgi">


<div><label>Multiplicand 1: <input name="m" size="5"></label></div>


<div><label>Multiplicand 2: <input name="n" size="5"></label></div>


<div><input type="submit" value="Multiply!"></div>


</form>


<form action="http://192.168.44.128/cgi-bin/ collect.cgi"


 method="POST">


<div><label for="data">Your input</label> (80 chars max.):</div>


<div><input id="data" name="data" size="60" maxlength="80"></div>


<div><input type="submit" value="Send"></div>


</form>


1、  新建文件collect.c


#vim collect.c


#include <stdio.h>


#include <stdlib.h>


#define MAXLEN 80


#define EXTRA 5


/* 4 for field name "data", 1 for "=" */


#define MAXINPUT MAXLEN+EXTRA+2


/* 1 for added line break, 1 for trailing NUL */


#define DATAFILE "../data/data.txt"


 


void unencode(char *src, char *last, char *dest)


{


//URL编码数据进行解码URL数据会以data=xxx的形式编码


//URL编码和ASCII值的对应关系可以看这里


// http://www.zhongguosou.com/html/html_urlencode.html


 for(; src != last; src++, dest++)


   if(*src == '+')


     *dest = ' ';


//遇到+转化为空格


   else if(*src == '%') {


     int code;


     if(sscanf(src+1, "%2x", &code) != 1) code = '?';


     *dest = code;


/*如果发现以%开头的,则为特殊字符的编码,检查%后的两位十六进制是否是特殊符号编码,如果是则将取符号的ASCII值,比如!被编码为%21,其ASCII值为21dest中将保存值21*/


     src +=2; }    


   else


     *dest = *src;


//非特殊字符直接保存


 *dest = '\n';


 *++dest = '\0';


//最后加上换行和字符串结束符


}


 


int main(void)


{


char *lenstr;


char input[MAXINPUT], data[MAXINPUT];


long len;


printf("%s%c%c\n",


"Content-Type:text/html;charset=iso-8859-1",13,10);


printf("<TITLE>Response</TITLE>\n");


lenstr = getenv("CONTENT_LENGTH");


if(lenstr == NULL || sscanf(lenstr,"%ld",&len)!=1 || len > MAXLEN)


  printf("<P>Error in invocation - wrong FORM probably.");


else {


  FILE *f;


  fgets(input, len+1, stdin);


/*fetts从指定输入流读取字符串,原型为:char *fgets(char *s,int n,FILE *stream)stream读入字符串到s,当读入n-1个字符或换行符时,函数停止操作,改函数在s的末尾增加一个NULL字符表明串的结束.成功返回指向s的指针,遇到文件结束或出错返回EOF*/


  unencode(input+EXTRA, input+len, data);


  f = fopen(DATAFILE, "a");


/*以追加方式打开文件, 打开只读文件,该文件必须存在。


r+ 打开可读写的文件,该文件必须存在。


打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。


w+ 打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。


以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。


a+ 以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。


上述的形态字符串都可以再加一个b字符,如rbw+bab+等组合,加入字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。不过在POSIX系统,包含Linux都会忽略该字符。*/


  if(f == NULL)


    printf("<P>Sorry, cannot store your data.");


  else


fputs(data, f);


/*将字符串data写入文件f,fputs函数的功能是向指定的输出流拷贝一个以NULL为结束符的字符串*/,


  fclose(f);


  printf("<P>Thank you! Your contribution has been stored.");


  }


return 0;


}


#gcc –o collect.cgi collect.c


#mv collect.cgi /var/www/cgi-bin/


2、  在浏览器中输入:192.168.44.128/html/multiple.html


页面上出现了我们刚才增加的一个输入框,在输入框中输入一段文字,点击提交按钮,文字就被保存到文件中了。

呵呵上面的C源文件其实是有一点点小问题的,就是规范上的问题,当然对于这点小问题来说Apache等高级的服务器是忽略的,但是对于即优秀又弱智的boa来说可就不会给你好好工作了呵呵!用boa的朋友们会发现运行以后会出现502错误!呵呵好好分析一下,网上给出了最普通的原因为权限和lib库问题,还有一个原因就是HTML写的不标准呵呵