深入理解Java虚拟机 第七章 虚拟机类加载时机与过程

时间:2022-12-27 15:05:02

虚拟机类加载机制:

虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型。

  • 类在虚拟机中的生命周期包括(其中 验证、准备、解析3个部分称为连接。
    加载(Loading)
验证(Verification)
连接(Linking) ---- 准备(Preparation)
解析(Resolution)
初始化(Initialization)
使用(Using)
卸载(Unloading)。
  • 类加载的顺序
    加载、验证、准备、初始化、卸载这5个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班的开始(这些阶段都是互相交叉的混合式进行,通常会在一个阶段执行过程中调用、激活下一个阶段),而解析阶段则不一定,它可能会因为支持动态绑定而在初始化之后。

7.2 类加载的时机

  • 虚拟机并没有约束什么时候情况下进行类加载阶段,但虚拟机规定有且只有5种情况必须立即对类进行初始化阶段,如果没有初始化的话。

    1. 遇到new、getstatic、putstatic、invokestatic这4条字节码指令时,
      场景是 new实例化对象时读取或设置一个类的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)调用一个类的静态方法
    2. 使用java.lang.reflect包的方法对类进行反射调用时。
    3. 当初始化一个类时,发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
    4. 当虚拟机启动时,虚拟机会先初始化包含main()方法的主类。
    5. 使用JDK1.7的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄时。
  • 有且只有上述5种情况会对类进行初始化,下面情况为类的被动引用。

    1. 子类引用父类的静态字段,不会导致子类初始化。
    2. 通过数组定义来引用类,不会触发此类的初始化。new ChildClass[0]
    3. 常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化。
  • 接口的加载过程
    接口也有初始化阶段,接口中不能使用static{}语句块,但编译器仍会为接口生产<clinit>类构造器,用于初始化接口中所定义的成员变量。
    接口与类的真正区别是初始化场景的第三条:当一个类在初始化时,要求其父类全部都已经初始化过;但一个接口在初始化时,并不要求其父类接口全部都完成了初始化,只有在真正使用到父类接口时(如引用接口中定义的接口)。

// 对接口也适用
class AAAA{
public static final int a = 1; //不会引起类加载
public static final Integer b = 1; //会
public static final List<String> c = new ArrayList<>(); //会

public static final String s = "s"; //不会
public static final String sc = new String("sc"); //会
static {
System.out.println("AAAA 初始化"); //验证类是否加载,在类初始化阶段会调用
}
}

7.3 类加载的过程

7.3.1 加载

  • 在加载阶段,虚拟机需要完成3件事情:

    1. 通过一个类的全限定名来获取定义此类的二进制字节流
    2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
    3. 在内存中生产一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口
  • 加载阶段(获取非数组类的二进制字节流)既可以使用系统提供的引导类加载器来完成,也可以由用户自定义的类加载器去完成,即通过定义自己的类加载器去控制字节流的获取方式。

  • 数组类本身不通过类加载器创建,它是由虚拟机直接创建的。但其元素类型要靠类加载器去创建。
    数组的可见性与它的组件类型可见性一致,如果组件类型不是引用类型,则默认为public。
    一个数组类的创建遵循以下规则:

    • 如果数组的组件类型是引用类型(Object[]),那就递归采用本节中定义的加载过程(上述123)去加载这个组件类型,该数组将在加载该组件类型的类加载器名称空间上被标识。(一个类必须与类加载一起确定唯一性。)
    • 如果数组的组件类型不是引用类型(int[]),Java虚拟机将会把该数组标记为与引导类加载器关联。
  • 加载完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区中,方法区中数据存储格式由虚拟机实现自行定义。
    然后再内存中实例化一个java.lang.Class类的对象(没有明确规定是堆中),这将作为程序访问方法区中的这些类型数据的外部接口。

7.3.2 验证

验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,且不会危害虚拟机自身的安全。

  • Java虚拟机载入的字节码文件,使用Java语言生产的Class文件一般会在编译期间就会检查错误,但使用其他方式生产的Class不一定是安全的,所以验证是虚拟机对自身保护的一项重要工作。

  • 验证阶段的工作量在虚拟机的类加载子系统中又占了相当大的一部分。整体来看,验证阶段大致上会完成下面4个阶段的检验动作:

    1. 文件格式验证

      • 比如:是否以魔数0xCAFEBABE开头、主次版本号是否在当前虚拟机处理范围内、常量池的常量中是否有不被支持的常量类型、指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
      • 这个验证阶段的主要目的是保证输入的字节流能正确的解析并存储于方法区内,格式上符合一个Java类型信息的要求。
        这个阶段的验证是基于二进制字节流进行的,只有通过了这个阶段的验证后,字节流才会进入内存的方法区中进行存储。
        下面的3个验证阶段全部是基于方法区的存储结构进行的,不会再直接操作字节流。
    2. 元数据验证

      • 比如:该类是否有父类(除了java.lang.Object)、不允许被继承的类(final)却被继承了、抽象类的方法是否被实现类全部实现、类中的字段、方法是否与父类产生矛盾(final方法继承、或者有不符合规则的重载)
      • 第二个阶段是对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求。
    3. 字节码验证

      • 第三阶段是整个验证过程中最复杂的一个阶段,主要目的是通过数据流和控制流分析,确定程序语义是否是合法的、符合逻辑的。这个阶段对类的方法体进行校验分析,保证被校验类的方法在运行时不会做出危害虚拟机安全的时间。
      • 比如:
        保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作。保证不会出现 在操作数栈放置一个int类型的数据,使用时却按long类型来加载如本地变量表中。
        保证跳转指令不会跳转到方法体以外的字节码指令上。
        保证方法体中的类型转换是有效的。
    4. 符合引用验证

      • 最后一个极端的校验发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在连接的的第三阶段(解析阶段)发生。
        目的是确保解析动作能正常的执行,如果无法通过符合引用验证,将会抛出java.lang.IncompatibleClassChangeError异常的子类,如IllegalAccessError、NoSuchFieldError、NoSuchMethodError
      • 符号引用验证可以看做是对类自身以外的信息进行匹配性校验,比如:
        符合引用中通过字符串描述的全限定名是否有相应的类
        在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段
        符号引用中的类、字段、方法的访问性(限定修饰符private、default、protected、public)是否可以被当前类访问。

7.3.3 准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段。这些变量所使用的内存都将在方法区中进行分配。

  • 首先,这时候进行内存分配的仅包括类变量(static修饰),而不包括实例变量,实例变量会在对象实例化时随着对象一起分配在Java堆中;
    其次,设置类变量的初始值是数据类型的零值,因为这时候并未开始执行任何Java方法。而赋值操作是putstatic指令被编译后,该指令存放于类构造器()方法中,所以赋值操作是在初始化阶段才会执行。
    public static int value = 123,value在这个阶段会被设置为0。

  • 特殊情况:如果类字段的字段属性表中存在ConstantValue属性,那在准备阶段会被直接赋值。
    public static final int value = 123,value会被设置为123。

7.3.4 解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。

  • 符号引用(Symbolic References):
    符号引用以一组符号来描述锁引用的目标。
    符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。
    各种虚拟机实现的内存布局可以不同,但他们能接受的符号引用必须都是一致的,因为符号引用的字面量形式明确定义在Java虚拟机规范的Class文件格式中。

  • 直接引用(Direct References):
    直接引用可以是直接指向目标目标的指针、相对偏移量或是一个能间接定位到目标的句柄。
    直接引用是和虚拟机实现的内存布局相关的,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。
    如果有了直接引用,那引用的目标必定已经在内存中存在。

  • 虚拟机规范中并未规定解析阶段发生的具体时间。所以虚拟机可以根据需要来判断到底是在类被加载器加载时就对常量池的符号引用进行解析,还是等到一个符号引用被使用前再去解析它。

  • 解析动作主要针对类、接口、字段、类方法、接口方法、方法类型、方法句柄、调用点限定符7类符号引用进行。

7.3.5 初始化

类初始化阶段是类加载过程的最后一步。初始化阶段是执行类构造器方法的过程。

  • 方法是由编译器自动收集类中的所有类变量的赋值动作静态语句块(static{})中的语句(包括赋值操作、方法等)合并而成的。
    编译器收集的顺序是由语句在源文件中出现的顺序所决定的。
    静态语句块中只能访问到定义在静态语句块之前的变量。定义在它之后的变量,在前面的静态语句块可以赋值,但不能访问。
static {
a = 2; //可以赋值

// Cannot reference a field before it is defined
System.out.println(a); //不能访问
}
public static int a = 1;
  • 方法与类的构造函数(实例构造器()方法)不同,它不需要显示的调用父类构造器。虚拟机会保证在子类的()方法执行之前,父类的()方法已经执行完毕。
    因此在虚拟机中第一个被执行的()方法的类肯定是java.lang.Object。

  • 由于父类的()先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作。

  • ()对于类或接口来说并不是必须的。
    如果一个类中没有静态语句块,也没有对变量的赋值操作,那么编译器可以不为这个类生产()方法。

  • 接口中不能使用静态语句块,但仍然有变量初始化的赋值操作,因此也有生成()方法。
    但与类不同的是,执行接口的()不需要先执行父接口的()。只有当父接口中定义的变量被使用时,父接口才会初始化。
    接口的实现类在初始化时也一样不会执行接口的()方法。

  • 虚拟机会保证一个类的()方法在多线程环境中被正确的加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的()方法,其他线程都需要阻塞等待。
    所以不要在静态代码块中有耗时很长的操作。