我们在编写Java程序之后,会通过编译器得到一个class文件,这个class文件是如何与JVM进行配合的呢?类中的信息是如何变成JVM可以使用的Java类型呢?这些都是类加载机制做到的。
虚拟机把描述类的数据从class文件中加载到内存里,并对数据进行校验,转换解析和初始化,最终形成被虚拟机直接使用的Java类型,这就是类加载机制。
类的生命周期
一个类从加载进入内存到卸载出内存,一共经过以下几个生命周期。
- 加载
- 验证
- 准备
- 解析
- 初始化
- 使用
- 卸载
这篇文章主要说明前5个生命周期,也就是说主要总结类从加载到使用的过程。
类的加载的过程
类的第一个生命周期是加载,那么类是什么时候执行加载过程的呢?这个过程JVM规范并没有明确说明,但是针对类的初始化,JVM给出了硬性的规定,只有以下五种情况才会进行类的初始化。
- 遇到
new
,getStaic
,putStatic
,invokestatic
这四个字节码指令时,这四个字节码对应的Java代码场景是:使用new关键字实例化对象,读取或设置一个类的静态属性的时候(该属性被final修饰除外),调用一个类的静态方法的时候。 - 使用反射对类进行调用的时候
- 当初始化一个类,而他父类还没有初始化的时候,则需要先初始化他的父类
- main函数所在的那个类。
- JDK7中一个methodHandle实例最后的解析结果为
REF_getStatic
,REF_putStatic
,REF_invokeStatic
,该方法对对应的类还没有初始化的时候,就会触发其初始化。该方法详见博客
上述说明了类初始化的时机,那么类的加载自然要在初始化之前。这也说明了在运行时才会执行类的初始化。
那么加载的这个过程,JVM做了什么工作呢?在加载阶段,JVM主要完成3件事情
- 通过一个类的全限定名来获取定义此类的二进制字节流
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
- 在内存中生成一个代表这个类的
java.lang.Class
对象,作为方法区这个类的各种数据的访问入口。
我们先说第一步,通过一个类的全限定名来获取此类的二进制字节流。这个说法实际上是很大的一个操作的空间,这也是各种Java技术能够实现的基础。比如,我们可以通过zip包中获取,那么就有了后来的jar,war,我们还可以通过网络中获取这个类,这就是applet,甚至动态代理,运行时在生成特定的class二进制流,或者由其他文件生成,比如JSP,由JSP文件生成对应的Class文件。
那么,为什么这一步会出现这么多种类繁多的加载技术呢,是因为通过一个类的全限定名来获取定义此类的二进制字节流这一动作是放到了Java虚拟机外部去实现的,是为了方便让应用自己去决定如何获取所需要的类。实现这个动作的功能是常说的类加载器。
类加载器的功能就是将获取class文件,并将其转换为class对象。因为class对象是由类加载器得到的,所以如果比较两个类是否相等,也必须在同一个类加载器加载的前提下,这里的相等时包括class对象的equals,instanceOf等作出的判断。
那么,针对JDK中这么多的类,以及还有我们自己编写的类,是否都是用同一个类加载器加载的呢?这显然不是,我们从Java开发者角度来看看究竟有哪些类加载器,他们是怎么配合的。
- 启动类加载器
- 扩展类加载器
- 应用程序类加载器
启动类加载器是加载%JAVA_HOME/lib目录中的类,虚拟机按照名字来识别,比如rt.jar,不是虚拟机认可的名字,即使放在下面也没有用。该加载器是JVM自身的一部分。
扩展类加载器是负责加载$JAVA_HOME/lib/ext目录下的类。该加载器继承自ClassLoader。
应用程序加载器或者叫做系统类加载器,负责加载ClassPath上指定的类,如果应用程序没有自定义过自己的类加载器,一般情况这个就是程序默认的类加载器。
这三种加载器是相互配合使用,配合的方式是双委派模型,如下图所示:
双亲委派模型的工作过程如下:
如果一个类加载器收到了类加载的过程,他首先不会自己去尝试加载这个类,而是把这个类委派给自己的父类加载器去完成,每一个层次的加载器都是如此,因为所有的类的加载请求都会最终传到顶层的启动类加载器中,只有父类的加载器无法完成这个加载请求时,子加载器才会去尝试自己的加载。
这样做的做的目的在于,保持类在整个JVM中唯一性,上面我们说过了,只有同一个类加载器加载出的类才是相等,如果我们编写了一个Object类,而不采用双亲委派模型的形式去加载,那么会加载出很多不同的Object类。
至此,类的加载阶段就介绍完毕,告一段落了。
类的链接阶段
类的链接阶段主要包含验证,准备,解析这三个阶段,本文简要说明这个三个阶段做的事情。
- 验证阶段是验证加载类的信息是否会危害虚拟机
- 准备阶段是正式将类变量分配内存并设置类初始值的阶段,这些都是在方法区进行分配
- 解析阶段是将常量池的符号引用替换为直接引用的过程
类的初始阶段
类的初始化阶段才会真正执行Java代码中那些语句。
初始化阶段是执行类构造器
<clinit>()
方法的过程。类构造器<clinit>()
方法是由编译器自动收藏类中的所有类变量的赋值动作和静态语句块(static块)中的语句合并产生
当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化
虚拟机会保证一个类的<clinit>()
方法在多线程环境中被正确加锁和同步