JVM原理(十二):JVM虚拟机类加载过程

时间:2024-07-06 22:54:24

一个类型从被加载到虚拟机内存中开始,到卸载为止,它的整个生命周期将会经过 加载、验证、准备、解析、初始化、使用、卸载七个阶段。其中 验证、准备、解析三个部分统称为 连接

1. 加载

加载是整个类加载的一个过程。在加载阶段,Java虚拟机需要完成三件事情:

  • 通过一个类的全限定名来获取定义此类的二进制字节流。

  • 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。

  • 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口(生成在方法区,相当于模板)。

因为Java虚拟机对着三点要求不是特别具体,没有指明二进制字节流必须得从某个Class文件中获取,确切的说根本没有说从哪里获取,怎么获取,所以开发人员玩出了各种花样。

  •  从ZIP压缩包中读取,这很常见,最终成为日后JAR、EAR、WAR格式的基础。
  • 从网络中获取,这种场景最典型的应用就是WebApplet。
  • 运行时计算生成,这种场景使用得最多的就是动态代理技术,在javalangreect.Proxy中,就是用了ProxyGenerator.gnerateProxyClass()来为特定接口生成形式为“*SProxy”的代理类的二进制字节流。
  • 由其他文件生成,典型场景是JSP应用,由ISP文件生成对应的Class文件。
  • 从数据库中读取,这种场景相对少见些,例如有些中间件服务器(如SAPNetweaver)可以选择把程序安装到数据库中来完成程序代码在集群间的分发。
  • 可以从加密文件中获取,这是典型的防Class文件被反编译的保护措施,通过加载时解密Class文件来保障程序运行逻辑不被窥探。 

数组类

对于数组类而言,情况就有所不同,数组类本身不通过类加载器创建,它是由Java虛拟机直接在内存中动态构造出来的。但数组类与类加载器仍然有很密切的关系,因为数组类的元素类型 (ElementType,指的是数组去掉所有维度的类型) 最终还是要靠类加载器来完成加载,一个数组类(下面简称为C)创建过程遵循以下规则:

  1.  如果数组的组件类型(Componcnt Typc,指的是数组去掉一个维度的类型,注意和前面的元素类型区分开米)是引用类型,那就递归采用本节中定义的加载过程去加载这个组件类型,数组C将被标识在加载该组件类型的类加载器的类名称空间上(这点很重要,在7.4节会介绍,一个类型必须与类加载器一起确定唯一性)。
  2. 如果数组的组件类型不是引用类型(例如int]数组的组件类型为int),Java虚拟机将会把数组C标记为与引导类加载器关联。
  3. 数组类的可访问性与它的组件类型的可访问性一致,如果组件类型不是引用类型,它的数组类的可访问性将默认为public,可被所有的类和接口访问到。

总结

加载阶段与连接阶段的部分动作(如一部分字节码文件格式验证动作)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始,但这些夹在加载阶段之中进行的动作,仍然属于连接阶段的一部分,这两个阶段的开始时间仍然保持着固定的先后顺序。

2. 验证

目的是确保Class文件的字节流包含的信息符和《Java虚拟机规范》的全部约束要求,保证信息被当作代码运行后不会危害虚拟机自身安全。


验证过程:文件格式验证、元数据验证、字节码验证和符号引用验证。

2.1. 文件格式验证

第一阶段要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。

2.2. 元数据验证

元数据:元数据是指用来描述数据的数据,更通俗一点,就是描述代码间关系,或者代码与其他资源(例如数据库表)之间内在联系的数据。

第一, 元数据以标签的形式存在于Java代码中。
​
第二, 元数据描述的信息是类型安全的,即元数据内部的字段都是有明确类型的。
​
第三, 元数据需要编译器之外的工具额外的处理用来生成其它的程序部件。
​
第四, 元数据可以只存在于Java源代码级别,也可以存在于编译之后的Class文件内部。

 JDK5.0出来后,java语言中就有了四种类型(TYPE),即类(class)、枚举(enum)、接口(interface)和注解(@interface),它们是处在同一级别的。java就是通过注解来表示元数据的。

主要目的是对类的元数据信息进行语义校验,保证不存在与《Java语言规范》定义相勃的元数据信息。

总结

验证阶段对于虚拟机的类加载机制来说,是一个非常重要的、但却不是必须要执行的阶段,因为验证阶段只有通过或者不通过的差别,只要通过了验证,其后就对程序运行期没有任何影响了。如果程序运行的全部代码(包括自己编写的、第三方包中的、从外部加载的、动态生成的等所有代码)都已经被反复使用和验证过,在生产环境的实施阶段就可以考虑使用-Xverify: none参 数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。

3. 准备

准备阶段是正式为类中定义(即静态变量,被static修饰的变量)分配内存并设置类变量初始值的阶段。

4. 解析

解析阶段是Java虚拟机将常量池内的符号引用替换为直接引用的过程


符号引用和直接引用

符号引用:

  • 符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。

直接引用:

  • 直接引用是可以直接指向目标的指针、相对偏移量或者是一个能间接定位到目标的句柄。


解析动作主要针对:类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符这7类符号引用进行。

5. 初始化

直到初始化阶段,Java虚拟机才真正开始执行类中编写的Java程序代码,将主导权移交给应用程序。

初始化含义:根据程序员通过程序编码制定的主观计划去初始化类变量和其他资源。也可以理解初始化阶段就是执行类构造器<clinit>()方法的过程。