从零开始学写HTTP服务器(七)muduo+tinyhttpd

时间:2024-10-25 07:28:00

(一)前言

对muduo内嵌的HttpServer进行了稍微的改进,融入了TinyHttpd中对CGI部分内容。


(二)代码

代码上传到了我的github仓库/NearXdu/欢迎交流学习。
支持GET、POST、CGI。


(三)CGI

简单的理解:如果客户请求的是静态数据,则web server直接将数据响应给客户端,如果是动态数据,那么将这个动态页面的请求交个CGI程序处理,不过web server需要配置一些环境变量来告诉CGI程序Method、URL等内容。具体一点的解释:

参考:/q/1010000000256516

首先,CGI是干嘛的?CGI是为了保证web server传递过来的数据是标准格式的,方便CGI程序的编写者。

web server(比如说nginx)只是内容的分发者。比如,如果请求/,那么web server会去文件系统中找到这个文件,发送给浏览器,这里分发的是静态数据。好了,如果现在请求的是/,根据配置文件,nginx知道这个不是静态文件,需要去找PHP解析器来处理,那么他会把这个请求简单处理后交给PHP解析器。Nginx会传哪些数据给PHP解析器呢?url要有吧,查询字符串也得有吧,POST数据也要有,HTTP header不能少吧,好的,CGI就是规定要传哪些数据、以什么样的格式传递给后方处理这个请求的协议。仔细想想,你在PHP代码中使用的用户从哪里来的。

当web server收到/这个请求后,会启动对应的CGI程序,这里就是PHP的解析器。接下来PHP解析器会解析文件,初始化执行环境,然后处理请求,再以规定CGI规定的格式返回处理后的结果,退出进程。web server再把结果返回给浏览器。

好了,CGI是个协议,跟进程什么的没关系。那fastcgi又是什么呢?Fastcgi是用来提高CGI程序性能的。

提高性能,那么CGI程序的性能问题在哪呢?”PHP解析器会解析文件,初始化执行环境”,就是这里了。标准的CGI对每个请求都会执行这些步骤(不闲累啊!启动进程很累的说!),所以处理每个时间的时间会比较长。这明显不合理嘛!那么Fastcgi是怎么做的呢?首先,Fastcgi会先启一个master,解析配置文件,初始化执行环境,然后再启动多个worker。当请求过来时,master会传递给一个worker,然后立即可以接受下一个请求。这样就避免了重复的劳动,效率自然是高。而且当worker不够用时,master可以根据配置预先启动几个worker等着;当然空闲worker太多时,也会停掉一些,这样就提高了性能,也节约了资源。这就是fastcgi的对进程的管理。

那PHP-FPM又是什么呢?是一个实现了Fastcgi的程序,被PHP官方收了。

大家都知道,PHP的解释器是php-cgi。php-cgi只是个CGI程序,他自己本身只能解析请求,返回结果,不会进程管理(皇上,臣妾真的做不到啊!)所以就出现了一些能够调度php-cgi进程的程序,比如说由lighthttpd分离出来的spawn-fcgi。好了PHP-FPM也是这么个东东,在长时间的发展后,逐渐得到了大家的认可(要知道,前几年大家可是抱怨PHP-FPM稳定性太差的),也越来越流行。

好了,最后来回来你的问题。 网上有的说,fastcgi是一个协议,php-fpm实现了这个协议

对。

有的说,php-fpm是fastcgi进程的管理器,用来管理fastcgi进程的

对。php-fpm的管理对象是php-cgi。但不能说php-fpm是fastcgi进程的管理器,因为前面说了fastcgi是个协议,似乎没有这么个进程存在,就算存在php-fpm也管理不了他(至少目前是)。 有的说,php-fpm是php内核的一个补丁

以前是对的。因为最开始的时候php-fpm没有包含在PHP内核里面,要使用这个功能,需要找到与源码版本相同的php-fpm对内核打补丁,然后再编译。后来PHP内核集成了PHP-FPM之后就方便多了,使用–enalbe-fpm这个编译参数即可。

有的说,修改了配置文件后,没办法平滑重启,所以就诞生了php-fpm

是的,修改之后,php-cgi进程的确是没办法平滑重启的。php-fpm对此的处理机制是新的worker用新的配置,已经存在的worker处理完手上的活就可以歇着了,通过这种机制来平滑过度。

还有的说PHP-CGI是PHP自带的FastCGI管理器,那这样的话干吗又弄个php-fpm出

不对。php-cgi只是解释PHP脚本的程序而已。


(四)TinyHttpd实现CGI

只有500行代码的Http服务器,支持CGI,GET、POST。
CGI脚本有perl编写。
源码下载地址:/projects/tinyhttpd/

主要看TinyHttpd中实现CGI。

void execute_cgi(int client, const char *path,
                 const char *method, const char *query_string)
{
//...
//...

//发送响应头
 sprintf(buf, "HTTP/1.0 200 OK\r\n");
 send(client, buf, strlen(buf), 0);

//创建用于父子进程通信的管道
//需要两个管道,因为管道不是全双工的
 if (pipe(cgi_output) < 0) {
  cannot_execute(client);
  return;
 }
 if (pipe(cgi_input) < 0) {
  cannot_execute(client);
  return;
 }

//创建子进程执行CGI脚本
 if ( (pid = fork()) < 0 ) {
  cannot_execute(client);
  return;
 }
 if (pid == 0)  /* child: CGI script */
 {
  char meth_env[255];
  char query_env[255];
  char length_env[255];

//dup用法见下
  dup2(cgi_output[1], 1);
  dup2(cgi_input[0], 0);
  close(cgi_output[0]);
  close(cgi_input[1]);
  sprintf(meth_env, "REQUEST_METHOD=%s", method);
  putenv(meth_env);//设置环境变量
  if (strcasecmp(method, "GET") == 0) {
   sprintf(query_env, "QUERY_STRING=%s", query_string);
   putenv(query_env);
  }
  else {   /* POST */
   sprintf(length_env, "CONTENT_LENGTH=%d", content_length);
   putenv(length_env);
  }
  execl(path, path, NULL);
  exit(0);
 } else {    /* parent */
// 父进程从管道读取子进程的结果并发送给客户
  close(cgi_output[1]);
  close(cgi_input[0]);
  if (strcasecmp(method, "POST") == 0)
   for (i = 0; i < content_length; i++) {
    recv(client, &c, 1, 0);
    write(cgi_input[1], &c, 1);
   }
  while (read(cgi_output[0], &c, 1) > 0)
   send(client, &c, 1, 0);

  close(cgi_output[0]);
  close(cgi_input[1]);
  waitpid(pid, &status, 0);
 }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67

(五)dup使用

参考:/blog/2159781

dup,dup2,dup3是linux下非常重要的函数,用来实现流的重定向,可以很方便实现一些很有趣的效果
原理:每个进程在内核中有相应的fd记录表,每个fd占用一项。调用dup()后,新产生的newfd与原oldfd
向同一内核文件表项,操作newfd与操作oldfd效果一样,比较常用的应用就是CGI编程。

详细描述见:/GODYCA/archive/2013/01/05/
下面看代码:

int main(int argc,char **argv)
{
    // 打开文件
    int fd = open("",O_CREAT|O_RDWR|O_TRUNC,S_IRUSR|S_IWUSR);
    assert(fd>0);

    // 通过新fd写文件
    read_write(fd);

    // dup实现标准输入重定向到文件 
    print2file(fd);

    // dup2实现标准输入重定向到文件
    print2file1(fd);

    return 0;
}

void read_write(int fd)
{
    // 拷贝fd,返回当前系统最小且没有被使用的fd
    int nfd = dup(fd);
    printf("old:%d new:%d\n",fd,nfd); // 3 4

    char buf[1024];
    memset(buf,'\0',1024);

    int n;

    // 读取控制台输入流,并通过nfd写入文件
    while((n = read(STDIN_FILENO,buf,1024))>0)
    {
        write(nfd,buf,n);
    }
}

void print2file(int fd)
{
    close(STDOUT_FILENO);

    /**
     * 关闭标准输出流,调用dup()后返回的系统最小可用fd,此时nfd=1。此时任何目标为STDOUT_FILENO的I/O操作,如printf()等数据都会流入fd对应的文件,太神奇了。
     * 如果fd为tcp套接字描述符,则会被发送到与客户端连接的socket上,这就是CGI的实现原理。这就能解释CGI程序中大量的printf()语句
     */
    int nfd = dup(fd);

    // 这两条打印语句会被写入文件中
    printf("old:%d new:%d\n",fd,nfd);
    printf("hello world\n");
}

void print2file1(int fd)
{
    /**
     * dup2可以指定拷贝后的newfd,原先的newfd会被关闭
     * dup2(fd,STDOUT_FILENO); 相当于 cose(STDOUT_FILENO); dup(fd); 
     */
    int nfd = dup2(fd,STDOUT_FILENO);
    printf("old:%d new:%d\n",fd,nfd);
    printf("dup2 test\n");
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61