Java虚拟机 类加载过程与机制

时间:2022-12-28 10:31:01

一、ClassLoader基本概念


    与C或C++编写的程序不同,Java程序并不是一个可执行文件,而是由许多独立的类文件组成的,每一个文件对应一个Java类。此外,这些类文件并非全部装入内存,而是根据程序需要逐渐载入。ClassLoader在JVM运行的时候加载Java核心的API,以满足Java程序最基本的需求,其中就包括用户定义的ClassLoader。

    这里所谓的用户定义,是指通过Java程序实现的两个ClassLoader:一个是ExtClassLoader,它的作用是用来加载Java的扩展API,也就是/lib/ext中的类;第二个是APPClassLoader,它是用来加载用户机器上CLASSPATH设置目录只能给的Class的,通常在没有指定ClassLoader的情况下,程序员自定义的类就由该ClassLoader进行加载。


二、ClassLoader加载流程


    当运行一个程序的时候,JVM启动,运行bootstrap classloader,该ClassLoader加载Java核心API(ExtClassLoader和AppClassLoader也在此时被加载),然后调用ExtClassLoader加载扩展API,③最后AppClassLoader加载CLASSPATH目录下定义的Class,这就是一个程序最基本的加载流程。

Java虚拟机 类加载过程与机制


三、类的加载过程(摘自此处)


    虚拟机类加载机制:虚拟机把描述类的数据从class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型。

    Java语言里,类型的加载和连接过程是在程序运行期间完成的。


类的生命周期

  加载 loading

  验证 verification

  准备 preparation

  解析 resolution

  初始化 initialization

  使用 using

  卸载 unloading



有且只有以下四种情况必须立即对类进行”初始化”(称为对一个类进行主动引用):

1.遇到new、getstatic、putstatic、invokestatic这四条字节码指令时(使用new实例化对象的时候、读取或设置一个类的静态字段、调用一个类的静态方法)。


2.使用java.lang.reflet包的方法对类进行反射调用的时候。


3.当初始化一个类的时候,如果发现其负类没有进行过初始化,则需要先触发其父类的初始化。


4.当虚拟机启动时,虚拟机会初始化主类(包含main方法的那个类)。
 


被动引用

1.通过子类引用父类的静态字段,不会导致子类初始化(对于静态字段,只有直接定义这个字段的类才会被初始化)。


2.通过数组定义类应用类:ClassA [] array=new ClassA[10]。触发了一个名为[LClassA的类的初始化,它是一个由虚拟机自动生成的、直接继承于Object的类,创建动作由字节码指令newarray触发。


3.常量会在编译阶段存入调用类的常量池。
 

编译器会为接口生成<clinit>()构造器,用于初始化接口中定义的成员变量。一个接口在初始化时,并不要求其父类接口全部完成了初始化,只有在真正使用到父接口的时候才会初始化。


(1) 加载

1.通过一个类的全限定名来获取此类的二进制字节流。


2.将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。


3.在java堆中生成一个代表这个类的Class对象,作为方法区这些数据的访问入口。
 

(2) 验证

    验证:确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。

(包括:文件格式验证、元数据验证、字节码验证和符号引用验证)


虚拟机规范:如果验证到输入的字节流不符合Class文件的存储格式,就抛出一个java.lang.VerifyError异常或其子类异常。



(3) 准备

    准备阶段是正式为类变量分配内存并设置类变量初始值(各数据类型的零值)的阶段,这些内存将在方法区中进行分配。但是如果类字段的字段属性表中存在ConstantValue属性,那在准备阶段变量值就会初始化为ConstantValue属性指定的值。


    public static final int value=122;


(4) 解析
    解析阶段是在虚拟机将常量池内的符号引用替换为直接引用的过程。

    符号引用:符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。

    直接引用:直接引用可以是直接指向目标的指针、相对偏移量或者一个能间接定位到目标的句柄。如果有了直接引用,那引用的目标必定已经在内存中存在。



(5) 初始化
    初始化阶段是执行类构造器<clinit>()方法的过程。

1.<clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{}块)中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序决定的。静态语句块只能访问到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块中可以赋值,但是不能访问。
 

2. 方法与实例构造器<init>()不同,不需要显示的调用父类构造器,虚拟机会保证在子类的<clinit>()方法执行之前,父类的<clinit>()已经执行完毕。


3. <clinit>()方法对于类或接口来说不是必须的,如果一个类中没有静态语句块也没有对变量的赋值操作,那么编译器可以不为这个类生成<clinit>()方法。


4. 执行接口的<clinit>()不需要先执行父接口的<clinit>()方法,只有当父接口中定义的变量被使用时,父接口才会被初始化。接口的实现类在初始化时也不会执行接口的<clinit>()方法。


5. 虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确的加锁和同步,如果多个线程同时去初始化一个类,则只会有一个线程去执行这个类的<clinit>()方法,其他线程需要阻塞等待。


四、类的加载机制


    JVM在加载类时默认采用的是父类委托模式。通俗的讲,就是某个特定的类加载器在接到加载类的请求时,首先将加载任务委托给父类加载器,依次递归,如果父类加载器可以完成类加载任务,就成功返回;只有父类加载器无法完成此加载任务时,才自己去加载。

Java虚拟机 类加载过程与机制


使用父类委托模式的原因:

1.可以避免重复加载,当父类已经加载了该类的时候,就没有必要子ClassLoader再加载一次。

2.如果不使用这种委托模式,那么可以随时使用自定义的String来动态替代Java核心API中定义的类型,这样会存在非常大的安全隐患,而父类委托的方式就可以避免这种情况,因为String已经在启动时被加载,所以,用户自定义类是无法加载一个自定义的ClassLoader。


五、总结(摘自此处)


    类加载器是 Java 语言的一个创新。它使得动态安装和更新软件组件成为可能。类加载器的相关话题包括基本概念、代理模式、线程上下文类加载器、与 Web 容器和 OSGi 的关系等。开发人员在遇到ClassNotFoundException和 NoClassDefFoundError等异常的时候,应该检查抛出异常的类的类加类加载器是 Java 语言的一个创新。它使得动态安装和更新软件组件成为可能。


参考文献:

http://www.cnblogs.com/yshb/archive/2012/11/05/2756194.html

http://blog.csdn.net/zhoudaxia/article/details/35824249#t3

http://www.ibm.com/developerworks/cn/java/j-lo-classloader/

《Java程序员面试宝典》