深入理解JVM 一:运行时数据区

时间:2021-10-06 04:48:47

当线程执行一个Java方法时,程序计数器记录的是正在执行的虚拟机的字节码指令的地址;如果正在执行Native方法,那么程序计数器的值为空(Undefined)。程序计数器内存区域是唯一一个在JVM中没有规定出现OutOfMemoryError情况的数据区。

深入理解JVM 一:运行时数据区

1.1程序计数器

程序计数器(Program Counter Register)是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Natvie方法,这个计数器值则为空(Undefined)。此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。

1.2Java虚拟机栈

在对象创建、分配的时候,Java学习或开发人员经常提到堆内存(Heap)和栈内存(Stack),而这种对内存的说法比较笼统、比较纯粹。真正的Java内存区域是比较复杂点。

Java虚拟机栈(Java Virtual Machine Stacks)是线程私有的,生命周期和线程一样长。JVM栈是用来存放局部变量表、操作数栈、动态链接、方法出口等信息。
局部变量表存放了编译期可知的各种基本类型(byte、short、int、long、float、double、boolean、char)、对象引用类型(reference类型)与returnAddress类型(指向了一条字节码指令的地址)。其中的64位长度long和double类型的数据会占用2个局部变量的空间(Slot),其它的基本数据类型会占用1个局部变量的空间。局部变量表所需的内存空间在编译期间完成分配,所以当变量进入一个方法时,要在帧中分配多大的局部变量空间的是完全确定的。方法运行期间不会改变局部变量表的大小。
JVM栈这块内存区域中存在两种异常:
*Error异常:线程请求所需要的栈内存 大于 虚拟机所允许的深度。
OutOfMemoryError异常:若JVM栈可以动态扩展,而扩展时无法请求到足够的内存时,就会报该异常。

1.3本地方法栈

本地方法栈(Native Method Stack)与JVM栈的作用非常相似,JVM栈是为Java方法服务,而本地方法栈是为Native方法服务。Sun HotSpot虚拟机(也就是jdk自带的虚拟机)直接地把 本地方法栈 与 JVM栈 合二为一。
和 JVM栈一样,本地方法栈也会抛*Error与OutOfMemoryError异常。

1.4Java堆

对于大多数应用来说,Java堆(Java Stack)是JVM所管理的内存区域中最大的一块。Java堆所有线程公有的一块内存区域,JVM启动时这块内存区域就被创建了。此内存区域唯一目的就是存放对象实例,几乎所有的对象实例以及数组都在这里分配内存。JIT编译的发展和逃逸分析技术的逐渐成熟,对象的全都分配到堆上并不是那么绝对了。

Java堆内存区域是 垃圾收集器管理 的主要区域,因此很多时候也被称为“GC堆”(Garbage Collected Heap)。为了方便垃圾回收,将Java堆分为:新生代和老年代。基于这一特点,现在的垃圾收集器基本采用 分代收集算法(在垃圾收集器的章节会讲到)。Java堆中内存区域还可以进行细致的划分,不管怎么划分它们都在Java堆中,它们仍然都是用来存储对象的实例。划分的作用就是更好的分配内存和垃圾回收。

Java堆是逻辑上连续,而物理存储上可以不连续的内存空间。当然我们也可以扩充内存,现在主流的VM是通过改变-Xmx和-Xms的值来控制(物理内存不能小于堆内存的设置值)。如果堆中的没有内存完成实例分配,并且堆内存无法再扩展时,将会抛OutOfMemoryError异常。

1.5方法区

方法区(Method Area)也是所有线程公有的内存区域,它存储已被虚拟机加载的类信息、常量、静态变量、即时编译器后的代码等数据。方法区也可以称为堆得一个逻辑部分,可以看出两者十分相似,但它还有一个别名叫做Non-Heap(非堆),目的就是与Java堆区分开。

在方法区中,又划分了一个特殊的区域—-永久代,就像它的名字一样,存储在永久代的数据能够“永久长生不死”。因为在HotSpot虚拟机中,GC分代收集拓展至方法区,管理方法区的内存就像管理Java堆中的内存一样,GC所到之处垃圾将荡然无存,而永久代的垃圾并不会被收集。所以就出现一个问题,永久代的垃圾过多时,将会引起内存溢出问题(永久代有-XX:MaxPermSize的上限,J9虚拟机和JRockit虚拟机只要没触碰到进程可用内存的上限,例如32位系统中的4GB,就不会出现问题)。为了解决方法区内存溢出问题,也有放弃永久代并逐步改为采用Native Method来实现方法区的规划了,JDK1.7的HotSpot中,已经把原本防在永久代的字符串常量池(见下一节1.6 运行时常量池)移除。

前面讲到方法区和Java堆非常相似,所以内存不需要物理上的连续,内存可选择固定大小或可扩展,除此相似之外,还有特殊之处,方法区可以选择不实现垃圾收集。这块区域的内存的回收目标主要是针对常量池的回收和对类型的卸载。

与Java同样,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

1.6 运行时常量池

运行时常量池(Runtime Constant Pool)是方法区的一部分,它用于存放编译期生成的各种字面量(比如字符串,有的称运行时常量池为字符串常量池)和符合引用,这部分将在类加载后进入方法区的运行时常量池中存放。

JVM对Class文件每一部分(当然包括常量池)的格式都有严格规定,每一个字节用于存储哪种数据都必须符合规范上的要求才会被虚拟机认可、装载和执行。但对于运行时常量池,并没有细节上的要求。一般来说,除了保存Class文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池中。

运行时常量池相对于Class文件常量池具有动态性。在运行期间有可能将新的常量放到池中,开发人员用的较多的是String类的intern()方法。

我们在1.5小讲到了方法区的特性,所以常量池作为方法区的一部分,也会受其限制。当常量池无法申请到内存时会抛OutOfMemoryError异常。

1.7直接内存

从图1.1中并没有看到直接内存(Direct Memory),所以直接内存并不是虚拟机运行时数据区的一部分。但它会被经常使用。也可能导致OutOfMemoryError异常。

在JDK1.4中新添加了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库(看图:本地方法库)直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中,显著提高性能,因为避免了在Java堆和Native堆来回复制数据。

直接内存的分配不会受Java堆大小的限制,但既然是内存,肯定会受本机总内存(RAM以及SWAP区或者分页文件)大小以及处理器寻址空间的限制。可以根据实际情况设置-Xmx等参数信息。若忽略直接内存,使得内存区域总和 大于 物理内存限制(包括物理的和操作系统级的限制),从而导致动态扩展时出现OutOfMemoryError异常。