《深入理解Java虚拟机之栈帧的结构》

时间:2022-12-27 16:50:26

  Java虚拟机栈是线程私有的,它描述的是Java方法执行的内存模型:每个方法在执行的同时会创建一个栈帧用于存局部变量表、操作数栈、动态链接、方法返回地址等信息。每一个方法从调用到执行完毕的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

  每一个栈帧都包含了局部变量表、操作数栈、动态链接、方法返回地址和一些额外的附加信息。在编译成class文件后,栈帧中需要多大的局部变量表和多深的操作数栈已经保存在字节码文件(class文件)的code属性中,因此一个栈帧需要分配多少内存,不会受到程序运行的影响,只会根据虚拟机的具体实现不同。

  一个线程中的方法调用链可能会很长,即有很多栈帧。对于一个当前活动的线程中,只有位于线程栈顶的栈帧才是有效的,称为当前栈帧(current stack Frame),这个栈帧关联的方法称为当前方法(current method),栈帧的概念图如下:

《深入理解Java虚拟机之栈帧的结构》

  局部变量表

  局部变量表是一组变量存储空间,用于存储方法参数和方法内部定义局部变量。在Java代码被编译成class文件,就在方法的code属性里通过max_locals数据项确立了该方法所需要分配的最大局部变量表容量。

  局部变量表的容量以容量槽为最小单位(slot),虚拟机规范并没有强制规定slot的大小,只是规定long和double两种64位长度的数据类型占用两个连续的slot,其它类型占用1个slot。

  虚拟机通过索引的定位方式使用局部变量表,索引值的范围为0到局部变量的最大slot值,在非static方法中,0代表的是“ this”,即当前调用该方法的引用,其余参数从1开始分配,当参数列表中的参数分配完后,就开始给方法内的局部变量分配。

  局部变量表中的slot是可以重用的,方法中定义的变量,其作用域并不一定会覆盖整个方法体,如果当前PC计数器的值已经超出了某个量的作用域,那么这个变量的slot可以交给其他slot使用,这样可以节省栈的空间。但是有的时候会对垃圾收集器GC有一定的影响。

public static void main(String[] args) {
byte[] placeholder = new byte[64 * 1024 * 1024];
System.gc();
}
   如上面的代码,会像堆内存中填充64MB的数据,虚拟机参数加入 -verbose:gc ,然后手动调用gc进行垃圾回收,我们发现并没有回收这64MB的内存结果如下:

《深入理解Java虚拟机之栈帧的结构》

  因为调用gc的时候,变量placeholder还处于作用域之内,所以不会被回收。然后我们对代码进行第一次修改,将该数组的创建放在代码快中:

  public static void main(String[] args) {
{
byte[] placeholder = new byte[64 * 1024 * 1024];
}
System.gc();
}
   加入花括号后,placeholder变量和gc处于两个不同的作用域,所以当执行gc的时候,该变量已经不在作用域内了,按理来说gc应该会回收这64MB的数据,但是事实上依然没有:

《深入理解Java虚拟机之栈帧的结构》

  我们对代码进行第三次修改:

 public static void main(String[] args) {
{
byte[] placeholder = new byte[64 * 1024 * 1024];
}
int a = 0;
System.gc();
}
  我们再次执行该代码,发现64MB的数据确实被回收了:

《深入理解Java虚拟机之栈帧的结构》

  在上面三段代码中,placeholder能否被回收的根本原因就是:局部变量表中的slot是否还存有placeholder数组对象的引用,第一次修改后,代码虽然离开了placeholder的作用域,但是在此之后,没有任何对局部变量的读写操作,placeholder原本占用的slot还没有被其它变量服用,所以gc Roots依然能找到该变量的指向堆内存对象的引用链,不会进行回收。在第二次修改后,由于int a=0 会将placeholder的slot的复用,所以该数组数据会被回收。我们可以使用手动设置该变量为null值来达到同样的效果,但是也不能对手动设置null这种方法过多的依赖。

 

  操作数栈

  操作数栈又被称为操作栈,它是一个后入先出的栈结构。同局部变量表一样, 在将代码编译成class文件时通过code属性的max_locals确定了操作数栈的最大深度。操作数栈中的每个元素可以是java中任何一种数据类型,32位的数据占1个栈容量,64位的数据占2个栈容量。

  当一个方法刚开始执行时,操作数栈里是空的,在方法的执行过程中,会有各种字节码指令向操作数栈中写入和提取内容,也就是出栈和入栈的过程。例如,在执行字节码指令iadd(两个int类型整数相加)时要求操作数栈中最接近栈顶的两个元素已经存入两个int类型的值,然后执行相加时,会将这两个int值相加,然后将相加的结果入栈。

  另外在虚拟机概念模型中,两个栈帧作为虚拟机栈的元素,相互之间完全是独立的。但大多数虚拟机的实现都会做一些优化处理, 令两个栈帧出现一部分重叠。让下面栈帧部分的操作数栈和上面栈帧部分的局部变量表重叠在一起,这样在进行方法调用的时候就可以共用一些数据了,无需额外的参数复制传递过程,重叠过程如下图所示:

《深入理解Java虚拟机之栈帧的结构》


  动态链接

  每个栈帧都包含一个指向运行时常量池中该栈帧所属性方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。在Class文件的常量池中存有大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用为参数。这些符号引用一部分会在类加载阶段或第一次使用的时候转化为直接引用,这种转化称为静态解析。另外一部分将在每一次的运行期期间转化为直接引用,这部分称为动态连接。

  

  方法返回地址

   当一个方法被执行后,有两种方式退出这个方法。第一种方式是执行引擎遇到任意一个方法返回的字节码指令,这时候可能会有返回值传递给上层的方法调用者(调用当前方法的的方法称为调用者),是否有返回值和返回值的类型将根据遇到何种方法返回指令来决定,这种退出方法方式称为正常完成出口(Normal Method Invocation Completion)。
   另外一种退出方式是,在方法执行过程中遇到了异常,并且这个异常没有在方法体内得到处理,无论是Java虚拟机内部产生的异常,还是代码中使用athrow字节码指令产生的异常,只要在本方法的异常表中没有搜索到匹配的异常处理器,就会导致方法退出,这种退出方式称为异常完成出口(Abrupt Method Invocation Completion)。一个方法使用异常完成出口的方式退出,是不会给它的调用都产生任何返回值的。
   无论采用何种方式退出,在方法退出之前,都需要返回到方法被调用的位置,程序才能继续执行,方法返回时可能需要在栈帧中保存一些信息,用来帮助恢复它的上层方法的执行状态。一般来说,方法正常退出时,调用者PC计数器的值就可以作为返回地址,栈帧中很可能会保存这个计数器值。而方法异常退出时,返回地址是要通过异常处理器来确定的,栈帧中一般不会保存这部分信息。
   方法退出的过程实际上等同于把当前栈帧出栈,因此退出时可能执行的操作有:恢复上层方法的局部变量表和操作数栈,把返回值(如果有的话)压入调用都栈帧的操作数栈中,调用PC计数器的值以指向方法调用指令后面的一条指令等。


 附加信息

 虚拟机规范允许具体的虚拟机实现增加一些规范里没有描述的信息到栈帧中,例如与高度相关的信息,这部分信息完全取决于具体的虚拟机实现。在实际开发中,一般会把动态连接,方法返回地址与其它附加信息全部归为一类,称为栈帧信息。

《深入理解Java虚拟机之栈帧的结构》 《深入理解Java虚拟机之栈帧的结构》 《深入理解Java虚拟机之栈帧的结构》