深入了解Java虚拟机

时间:2022-02-23 17:36:09

我们都知道Java虚拟机是用来运行我们编译好的.class文件的,class文件中夹带类的各种信息,虚拟机要运行这些文件,第一件事就是要加载到虚拟机中,这就引出了这次总结的问题——虚拟机是如何加载这些class文件的?加载后虚拟机是怎么处理文件中夹带的信息的?

类加载机制

首先什么事类加载机制,这里有必要先介绍一下概念: 
虚拟机把描述类的数据从CLass文件加载到内存中,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的java类型,这就是虚拟机的类加载机制。

类加载的时机

类从被加载到虚拟机开始,到卸载出内存为止,它的整个生命周期包括:加载、验证、准备、解析、初始化、使用和卸载7个阶段。它的生命周期如图所示: 
深入了解Java虚拟机 
其中加载、验证、准备、初始化和卸载这5个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班地开始,而解析阶段则不一定,为了支持java语言的运行时绑定,解析动作放在了类初始化之后。

类加载的全过程

加载

在加载阶段,虚拟机需要完成以下3件事情: 
1)通过一个类的全限定名来获取定义此类的二进制字节流。 
2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。 
3)在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。 
这是虚拟机规范的三点,但是并没有明确指出具体要怎么做。 
例如第一条:虚拟机要一个二进制字节流,但是没有明确指明要从哪里获取,怎么样获取,这就可以玩出很多花样来了。最常见的如从压缩包中读取,jar包啊、war包之类的。还有jsp文件直接生成对应的Class类。 
加载阶段完成之后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中,方法区中的数据存储格式由虚拟机实现自行定义,虚拟机规范未规定此区域的具体数据结构。然后在内存中实例化一个java.lang.Class类的对象(并没有明确规定是在java堆中,在HotSpot虚拟机中,Class对象是被放在了方法区里面,虽然它也是对象)

验证

验证是连接阶段的第一步,这一阶段是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。 
在验证阶段大致上会完成下面4个阶段的检验动作:文件格式校验、元数据验证、字节码验证、符号引用验证。 
1)文件格式校验 
要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。这个部分是直接操作字节流的,通过验证以后字节流就进入到内存中进行存储,之后的动作也就基于方法区的存储结构进行了,不再直接操作字节流。 
2)元数据验证 
这要做的是对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求。对类的元数据信息进行语义校验,这些数据主要描述数据的数据,通俗来说是描述代码之间的关系的数据。如子父类之间的关系等等。。。 
3)字节码验证 
这一步是最复杂的,主要目的是通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。这里校验的是类的方法体。 
4)符号引用验证 
最后一阶段的校验发生在虚拟机将符号引用转化成直接引用的时候,这个转化动作将在连接的第三个阶段———解析阶段中发生。符号引用验证可以看做是对类自身以外(常量池中的各种符号引用)的信息进行匹配性校验。它的目的是确保解析动作能正常执行,如果无法正常通过符号引用验证,那么将会抛出一个java.lang.IncompatibleClassChangeError异常的子类,如常见的NoSuchMethodError、IllegalAccessError。

准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。要注意的是,在这个阶段进行内存分配的只有static变量,并不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在java堆中。设置的初始值通常情况下是数据类型的零值,但是如果类变量被设置成final了,编译时会在字段属性表中生成ConstantValue属性,在准备阶段虚拟机就会根据ConstantValue设置。

解析

解析阶段是虚拟机将常量池的符号引用替换成直接引用的过程。 
符号引用:符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。 
直接引用:直接指向目标的指针、相对偏移量或是一个能间接到目标的句柄。 
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行,分别对应于常量池的CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodred_info、CONSTANT_InterfaceMethodref_info、CONSTANT_MethodType_info、CONSTANT_MethodHandle_info和CONSTANT_InvokeDynamic_info7种常量类型。 
1)类或接口的解析 
假设有类D,如果要解析一个符号引用N成类或接口C的直接引用: 
如果C不是一个数组类型,虚拟机会把代表N的全限定名传递给D的类加载器去加载类C。 
如果C是一个数组类型,并且数组的元素类型为对象,N的描述符类似”[Ljava/lang/Integer”,会按照上一条规则加载,如果N的描述符类似”java.lang.Integer”,那就会由虚拟机生成一个代表此数组维度和元素的数组对象。 
在完成前还要进行符号引用验证,确认D是否具备对C的访问权限。不具备则抛出”IllegalAccessError”异常。 
2)字段解析 
首先对字段表class_index项中索引CONSTANT_Class_info符号引用进行解析,也就是字段所属的类或接口的符号引用。如果解析成功,那将这个字段所属的类或接口用C表示,虚拟机还会对C进行后续字段的搜索。 
如果C本身就包含有相配的,或与C的相关的有继承关系的进行递归查找到有相配的,返回直接引用。返回成功还有权限验证。 
找不到则抛出NoSuchFieldError异常。 
3)类方法解析 
类方法解析和字段解析差不多,同样的查不到也会抛出NoSuchMethodError。 
4)接口方法解析 
从接口方法表class_index项中索引中找,如果找到的C是个类而不是接口,直接抛异常IncompatibleClassChangeError。 
后面的找法和类方法解析基本一样。找不到抛异常NoSuchMethodError。 
此外,接口中的方法因为都是默认public修饰的,所以不存在访问权限的问题,自然也不会抛出IllegalAccessError异常。

初始化

类初始化阶段是类加载的最后一步,初始化阶段是执行类构造器<clinit>()方法的过程。 
<clinit>()方法是有编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{}块)中的语句合并产生的。 
虚拟机会保证一个类的()方法在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>()方法,其他线程都需要阻塞等待,直到活动线程执行<clinit>()方法完毕。如果一个类的<clinit>()方法中有耗时很长的操作,就可能造成多个进程阻塞。


既然说到类加载机制,就必不可少地要说到类加载器了。

类加载器

虚拟机设计团队把类加载器阶段中的”通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部去实现,以便让应用程序自己决定如何取获取所需要的类。实现这个动作的代码模块称为”类加载器”。对于任意一个类,都需要由加载它的类加载器和这个类本身一同确立其在java虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名称空间。通俗来说就是两个类是否相等,先得以这两个类是不是同一类加载器加载为前提。从java虚拟机的角度来看,只存在两种不同的类加载器:一种是启动类加载器(BootStrap ClassLoader),这个类加载器是使用C++语言实现的,是虚拟机的一部分;另一种就是所有其他的类加载器,这些是独立于虚拟机外部的,都是由java语言实现的,并且都继承自java.lang.ClassLoader。 
从java开发人员角度来看,以下3种是最常使用的。 
1)启动类加载器(BootStrap ClassLoader) 
负责将存放在<JAVA_HOME>\lib目录中的,或者被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的类库加载到虚拟机内存中。 
2)扩展类加载器(Extension ClassLoader) 
负责加载<JAVA_HOME>\lib\ext目录中的,或者被java.ext.dirs系统变量所指定的路径中的所有类库。开发者可直接使用。 
3)应用程序类加载器 
ClassLoader的getSystemClassLoader()的返回值。负责加载用户类路径(ClassPath)上所指定的类库。 
我们的应用程序都是由这3种类加载器互相配合加载的,它们之间的关系如图所示: 
深入了解Java虚拟机

双亲委派模型

这就是我们老生常谈的类加载器的双亲委派模型。要求除了顶层的启动类加载器外,其余的类加载器都应当有自己的父类加载器。这里类加载器之间的父子关系一般不会以继承关系来实现,而是使用组合的关系来复用父加载器的代码。 
双亲委派模型的工作过程是这样的:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父类加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去加载。 
使用双亲委派模型的好处显而易见的就是java类随着它的类加载器一起具备了一种带有优先级的层次关系。它的实现很简单,我们来看看源代码

protected Class<?> loadClass(String name, boolean resolve)
throws ClassNotFoundException
{
synchronized (getClassLoadingLock(name)) {
// First, check if the class has already been loaded
Class<?> c = findLoadedClass(name);
if (c == null) {
long t0 = System.nanoTime();
try {
if (parent != null) {
c = parent.loadClass(name, false);
} else {
c = findBootstrapClassOrNull(name);
}
} catch (ClassNotFoundException e) {
// ClassNotFoundException thrown if class not found
// from the non-null parent class loader
}

if (c == null) {
// If still not found, then invoke findClass in order
// to find the class.
long t1 = System.nanoTime();
c = findClass(name);

// this is the defining class loader; record the stats
sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
sun.misc.PerfCounter.getFindClasses().increment();
}
}
if (resolve) {
resolveClass(c);
}
return c;
}
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37

步骤: 
先检查是否已经被加载过,若没有加载则调用父加载器的loadClass()方法,若父加载器为空则默认使用启动类加载器作为父加载器。如果父类加载器失败,抛出异常后再调用自己的findClass()方法进行加载。