Tomcat 原理分析

时间:2024-02-17 10:32:26

1、Tomcat 的组成

如下图:

Tomcat组成

Tomcat组成

Server: Tomcat 封装的、对外提供完整的、基于组件的 web 服务,包含 Connectors、Container 两个核心组件,以及多个功能组件,各个 Service 之间是独立的,但是共享 同一 JVM 的资源;

Connector: Tomcat 与外部世界的连接器,监听固定端口接收外部请求,传递给 Container,并将 Container 处理的结果返回给外部;

Container: Catalina,Servlet 容器,内部有多层容器组成,用于管理 Servlet 生命周期,调用 servlet 相关方法。

Loader: 封装了 Java ClassLoader,用于 Container 加载类文件;

Realm: Tomcat 中为 web 应用程序提供访问认证和角色管理的机制;

JMX: Java SE 中定义技术规范,是一个为应用程序、设备、系统等植入管理功能的框架,通过 JMX 可以远程监控 Tomcat 的运行状态;

Jasper: Tomcat 的 Jsp 解析引擎,用于将 Jsp 转换成 Java 文件,并编译成 class 文件。

Session: 负责管理和创建 session,以及 Session 的持久化(可自定义),支持 session 的集群。

Pipeline: 在容器中充当管道的作用,管道中可以设置各种 valve(阀门),请求和响应在经由管 道中各个阀门处理,提供了一种灵活可配置的处理请求和响应的机制。

Naming: 命名服务,JNDI, Java 命名和目录接口,是一组在 Java 应用中访问命名和目录服务的 API。命名服务将名称和对象联系起来,使得我们可以用名称访问对象,目录服务也是一种命名服务,对象不但有名称,还有属性。Tomcat 中可以使用 JNDI 定义数据源、配置信息,用于开发与部署的分离。


Container的组成:

Container的组成

Container的组成

Engine: Servlet 的顶层容器,包含一 个或多个 Host 子容器;

Host: 虚拟主机,负责 web 应用的部 署和 Context 的创建;

Context: Web 应用上下文,包含多个 Wrapper,负责 web 配置的解析、管理所有的 Web 资源;

Wrapper: 最底层的容器,是对 Servlet 的封装,负责 Servlet 实例的创建、执行和销毁。


2、Tomcat 的启动流程

Tomcat的启动流程

Tomcat的启动流程

1、启动从 Tomcat 提供的 start.sh 脚本开始

我们点击这个:

点击

点击

shell 脚本会调用 Bootstrap 的 main 方法,实际调用了 Catalina 相应的 load、start 方法。

实际上调用的方法

实际上调用的方法

2、解析配置文件

然后 load 等方法会读取 conf 文件夹下的配置文件:

读取配置文件

读取配置文件

在解析的过程中会根据 xml 中的关系 和配置信息来创建容器,并设置相关的属性。接着 Catalina 会调用 StandardServer 的 init 和 start 方法进行容器的初始化和启动。

3、生命周期

按照 xml 的配置关系,server 的子元素是 service,service 的子元素是顶层容器 Engine,每层容器有持有自己的子容器,而这些元素都实现了生命周期管理的各个方法,因此就很容易的完成整个容器的启动、关闭等生命周期的管理。

4、监听端口

StandardServer 完成 init 和 start 方法调用后,会一直监听来自 8005 端口(可配置),如果接收到 shutdown 命令,则会退出循环监听,执行后续的 stop 和 destroy 方法,完成 Tomcat 容器的 关闭。同时也会调用 JVM 的 Runtime.getRuntime() .addShutdownHook 方法,在虚拟机意外退出的时候来关闭容器。

5、ContainerBase

所有容器都是继承自 ContainerBase,基类中封装了容器中的重复工作,负责启动容器相关的组 件 LoaderLoggerManagerClusterPipeline,启动子容器(线程池并发启动子容器,通过 线程池 submit 多个线程,调用后返回 Future 对象,线程内部启动子容器,接着调用 Future 对象 的 get 方法来等待执行结果)。

3、Web 应用的部署方式

catalina.home 是 安装目录
catalina.base 是 工作目录 即 webapps

复制

Server.xml:

  • 配置 Host 元素;
  • 指定 appBase 属性;
  • 配置 Context 元素;
  • 指定 docBase 元素;
  • 指定 web 应用的路径

HostConfig 监听了 StandardHost 容器的事件,在 start 方法中解析上述配置文件:

  • 扫描并解析 webapps 下的所有文件夹和 war 包,解析各个应用的 META-INF / context.xml,并创建 StandardContext,并将 Context 加入到 Host 的子容器中。

jiexi

jiexi

ContextConfig 解析 context.xml 顺序:

  • 先解析全局的配置 config/context.xml

全局

全局

  • 然后解析 Host 的默认配置 EngineName/HostName/context.xml.default
  • 最后解析应用的 META-INF/context.xml

在这里插入图片描述

在这里插入图片描述

ContextConfig 解析 web.xml 顺序:

  • 先解析全局的配置 config/web.xml
  • 然后解析 Host 的默认配置 EngineName/HostName/web.xml.default 接着解析应用的 WEB-INF/web.xml
  • 扫描应用 WEB-INF/lib/下的 jar 文件,解析其中的 META-INF/web-fragment.xml 最后合并 xml 封装成 WebXml,并设置 Context

4、Servlet

Servlet 是用 Java 编写的服务器端程序。其主要功能在于交互式地浏览和修改数据,生成动态 Web 内容。

它由 wrapper 封装;生命周期如下:

  1. 请求到达 server 端,server 根据 url 映射到相应的 Servlet
  2. 判断 Servlet 实例是否存在,不存在则加载和实例化 Servlet 并调用 init 方法
  3. Server 分别创建 Request 和 Response 对象,调用 Servlet 实例的 service 方法(service 方法内部会根据 http 请求方法类型调用相应的 doXXX 方法)
  4. doXXX 方法内为业务逻辑实现,从 Request 对象获取请求参数,处理完毕之后将结果通过 response 对象返回给调用方
  5. 当 Server 不再需要 Servlet 时(一般当 Server 关闭时),Server 调用 Servlet 的 destroy() 方 法。

请求处理过程:

图片

  1. 根据 server.xml 配置的指定的 connector 以及端口监听 http、或者 ajp 请求
  2. 请求到来时建立连接,解析请求参数,创建 Request 和 Response 对象,调用顶层容器 pipeline 的 invoke 方法
  3. 容器之间层层调用,最终调用业务 servlet 的 service 方法
  4. Connector 将 response 流中的数据写到 socket 中

Pipeline 与 Valve :

Pipeline 可以理解为现实中的管道,Valve 为管道中的阀门,Request 和 Response 对象在管道中 经过各个阀门的处理和控制。

  • 每个容器的管道中都有一个必不可少的 basic valve,其他的都是可选的,basic valve 在管道中最 后调用,同时负责调用子容器的第一个 valve。
  • 各层容器对应的 basic valve 分别是 StandardEngineValveStandardHostValveStandardContextValveStandardWrapperValve

5、JSP 引擎

JSP 生命周期:

  • 编译阶段:servlet 容器编译 servlet 源文件,生成 servlet 类
  • 初始化阶段:加载与 JSP 对应的 servlet 类, 创建其实例,并调用它的初始化方法
  • 执行阶段:调用与 JSP 对应的 servlet 实例的 服务方法
  • 销毁阶段:调用与 JSP 对应的 servlet 实例的 销毁方法,然后销毁 servlet 实例

如图,JSP文件会被解析为 servlet 类。

JSP文件被解析

JSP文件被解析

这是随便拿的一个栗子,将上面的文件打开,可以看到有一部分文件正是将HTML标签写入到页面上。

在这里插入图片描述