深入理解JAVA虚拟机(一):内存区域与内存溢出异常

时间:2021-03-11 20:56:44

1、内存区域

Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域,称为运行时数据区域,如图所示。

深入理解JAVA虚拟机(一):内存区域与内存溢出异常

Java虚拟机内存结构中的程序计数器、虚拟机栈和本地方法栈这三个区域随线程创建而生,随线程销毁而灭,因此这三个区域的内存分配和回收是确定的,java垃圾收集器重点关注的是java虚拟机的堆内存和方法区内存。其中方法区和堆是由所有线程共享的数据区。Java虚拟机栈,本地方法栈和程序计数器是线程隔离的数据区。

(一)程序计数器

是一块较小的内存空间,其作用可以看作是当前线程所执行的字节码的行号指示器,字节码解析器工作时通过改变程序计数器的值来选取下一条需要执行的字节码指令。程序的分支、循环、跳转、异常处理以及线程恢复等基础功能都是依赖程序计数器来完成。

Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间片来实现,在任何一个时刻,一个处理器只会执行一条线程指令,因此,为了确保线程切换之后能恢复到正确的执行位置,每条线程都需要一个独立的程序计数器,因此程序计数器是线程私有的内存。

如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正咋执行的是Native方法,这个计数器值为空(Undefined)。程序计数器是java虚拟机中唯一一个没有规定任何内存溢出OutOfMemoryError的内存区域。

(二)Java虚拟机栈

Java虚拟机栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是java方法执行的内存模型:每个方法被执行时都会同时创建一个栈帧用于存放局部变量表、操作数栈、动态连接和方法出口等信息。Java虚拟机栈的局部变量表存放了编译器可知的8种java基本类型数据、对象引用(注意不是对象实例本身)、方法返回地址returnAddress。

Java虚拟机栈的局部变量表空间单位是槽(Slot),其中64位长度的double和long类型会占用两个slot,其余的数据类型只占用一个slot。局部变量表所需内存空间在编译期间完成分配,当进入一个方法时,该方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。

Java虚拟机栈有两种异常状况:如果线程请求的栈深度大于虚拟机所允许的最大深度时,抛出*Error异常;如果虚拟机栈可以动态扩展,当扩展时无法申请到足够内存时会抛出OutOfMemoryError异常。

(三)本地方法栈

本地方法栈与java虚拟机栈作用非常类似,其区别是:java虚拟机栈是为虚拟机执行java方法服务,而本地方法栈是为虚拟机调用的操作系统本地方法服务。Java虚拟机规范没有对本地方法栈的实现和数据结构做强制规定,Sun HotSpot虚拟机直接把java虚拟机栈和本地方法栈合二为一。与java虚拟机栈类似,本地方法栈也会抛出*Error异常和OutOfMemoryError异常。

(四)Java

堆是java虚拟机所管理的内存区域中最大一块,java堆是被所有线程所共享的一块内存区域,在java虚拟机启动时创建,堆内存的唯一目的就是存放对象实例。几乎所有的对象实例都是在堆分配内存。

Java堆是垃圾收集器管理的主要区域,从垃圾回收的角度看,由于现在的垃圾收集器基本都采用的是分代收集算法,因此java堆还可以初步细分为新生代和年老代。

Java虚拟机规范规定,堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。在实现上即可以是固定大小的,也可以是可动态扩展的。如果在堆中没有内存完成实例分配,并且堆大小也无法在扩展时,将会抛出OutOfMemoryError异常。

(五)方法区

方法区与堆一样,是被各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。虽然java虚拟机规范把方法区描述为堆的一个逻辑部分,但是方法区却有一个别名叫Non-Heap(非堆)。

Sun HotSpot虚拟机把方法区叫永久代(Permanent Generation),方法区中最重要的部分是运行时常量池。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面变量、符号引用、直接引用等,这些内容将在类加载后存放到方法区的运行时常量池中,另外在运行期间也可以将新的常量存放到常量池中,如String的intern()方法。方法区和运行时常量池在无法满足内存分配时,也会抛出OutOfMemoryError异常。

(六)直接内存

直接内存并不是java虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域,但是在java开发中还是会使用到。JDK1.4中新引入的NIO(new I/O),引入了一种基于通道(Channel)和缓冲区(Buffer)的I/O方式,可以使用操作系统本地方法库直接分配堆外内存,然后通过一个存储在java堆里面的DirectByteBuffer对象作为堆外直接内存的引用进行操作,避免了java堆内存和本地直接内存间的数据拷贝,可以显著提高性能。虽然直接内存并不直接收到java虚拟机内存影响,但是如果java虚拟机各个内存区域总和大于物理内存限制,从而导致直接内存不足,动态扩展时也会抛出OutOfMemoryError异常

2、HotSpot虚拟机对象

(一)对象的创建

虚拟机遇到一条new指令时,将进行以下步骤来创建对象:

(1)类的加载

检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经加载,解析和初始化过。如果没有,那必须先加载代表类。

(2)内存分配

类的加载检查通过后,接下来是给对象分配内存。对象所需内存的大小在类加载完成后便能完全确定。简单来说就是在Java堆中找到一块空闲的内存用来存储该对象信息。

(3)初始化内存空间

对象的内存分配好后接下来就是把这块内存空间都初始化为零。内存空间虽然为零但是对应java代码就是各类型的初始状态。

(4)对象必要设置

对象的必要设置包括了该对象是哪个类的实例,如何才能找到类的元数据信息(也就是类信息),对象的哈希吗(用于对象比较),对象的GC分代年龄(用于垃圾回收)等信息。这些信息都将会存储到一个成为对象头的数据结构中。对象头将会在对象布局时说明。

(二)对象的内存布局

(1)对象头

 包括两部分信息:     

1>第一部分用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID。偏向时间戳等。

2>第二部分是类型指针,即对象指向她的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据

(2)实例数据

 对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。

(3)对齐填充

 对齐填充仅仅起到的是占位符的作用。由于虚拟机自动内存管理系统要求对象的起始地址必须是8字节的整数倍,也就是对象的大小必须是8字节的整数倍,如果不是8字节的整数倍就需要通过对其填充来补全。

(三)对象的访问定位

 Java程序需要通过栈上的reference数据来操作堆上的具体对象。

(1)句柄

 Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自的具体地址信息。

深入理解JAVA虚拟机(一):内存区域与内存溢出异常

(2)直接指针

 Reference中存储的直接就是对象地址。

深入理解JAVA虚拟机(一):内存区域与内存溢出异常

使用句柄的优势在于reference中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要修改;使用指针的优势在于速度快,节省了一次指针定位的时间开销。