Java虚拟机:内存区域

时间:2022-12-27 13:47:59

一、jdk、jre、jvm之间的关系

从广义上讲,运行于java虚拟机上的语音及其相关的程序都属于java技术体系中的一员。Sun官方所定义的java技术体系包括以下几个组成部分:

  • 1 java程序设计语言
  • 2 各种硬件平台上的java虚拟机
  • 3 Class文件格式
  • 4 Java API 类库
  • 5 第三方Java类库
  • 把Java程序设计语言、java虚拟、javaAPI类库这三部分统称为JDK。把JavaAPI类库中的JavaSE API子集和Java虚拟机这两部分统称为JRE.JRE是java程序运行的标准环境。Jvm: Java Virtual Machine java虚拟机。三者之间关系图。
Java虚拟机:内存区域

 

二、Java虚拟机内存管理

虚拟机在执行java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有些区域则依赖用户线程的启动和结束而建立和销毁。

Java虚拟机:内存区域

 

2.1.线程共享区:

方法区:存储运行时常量池,已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。

Java堆:存储对象实例。

2.2线程独占区

本地方法栈:为jvm所调用到的Native脚本地方法服务。

虚拟机栈:存放方法运行时所需的数据,成为栈帧。

程序计数器:记录当前线程所执行的字节码的行号。三、程序计数器

程序计数器是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。程序计数器处于线程独占区。

如果线程执行的是Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址。如果正在执行的是native方法,这个计数器的值为undefined。此区域是唯一一个在java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。

四、虚拟机栈

虚拟机栈描述的是java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程.

Java虚拟机:内存区域

 

栈帧:每个方法执行,都会创建一个栈帧,伴随着方法从创建到执行完成。用于存储局部变量表,操作数栈,动态链接,方法出口等。局部变量表:存放编译期可知的各种基本数据类型,引用类型,returnAddress类型。

局部变量表在内存空间的编译期完成分配,当进入一个方法时,这个方法需要在帧分配多少内存是固定的,在方法运行期间是不会改变局部变量表的大小。

如果线程请求的栈深度大于虚拟机所允许的深度,将抛出*Error异常;如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),如果扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。

五、本地方法栈

与虚拟机栈所发挥的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务。

六、Java堆

存放对象事例。垃圾收集器管理的主要区域,新生代,老年代。Eden空间。通过-Xmx -Xms参数来控制堆内存的大小。如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。

七、方法区

存储虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。方法区并不等价于永久代。这区域的内存回收目标主要是针对常量池的回收和堆类型的卸载。

八、运行时常量池

方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外。还有一项信息是常量池。用于存放编译期生成的各种字面量和符号引用,者部分内存将在类加载后进入方法区的运行时常量池中存放。比如String str =”abc”。

九、直接内存:

并不是虚拟机运行时数据区的一部分。也不是Java虚拟机规范中定义的内存区域。新加入了NIO类,引入了一个基于通道和缓冲区的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。

对象的创建

对象的创建主要分四部分:1.给对象分配内存 2.线程安全性问题 3.初始化对象 4.执行构造方法

Java虚拟机:内存区域

 

对象分配内存:虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定(如何确定将在2.3.2节中介绍),为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。假设Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离,这种分配方式称为“指针碰撞”(Bump the Pointer)。

Java虚拟机:内存区域

 

如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象例,并更新列表上的记录,这种分配方式称为“空闲列表”(Free List)。

Java虚拟机:内存区域

 

选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。

线程安全问题:对象创建在虚拟机中是非常频繁的行为,即使是仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的,可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况。方案一:一种是对分配内存空间的动作进行同步处理,实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性。

方案二:把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定。

Java虚拟机:内存区域

 

初始化对象:内存分配完成后,虚拟机需要将分配到内存空间都初始化为零值。执行构造方法:虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例,如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。

对象的内存布局

在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。

1.Header(对象头)包含两部分信息,第一部分用于存储对象自身的运行时数据(Mark Word) 哈希码 GC分代年龄 锁状态标志 线程持有的锁,偏向线程ID 偏向时间戳。根据锁的状态不同,把这个对象头区域记录不同的信息,

2.类型指针:即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

3.InstanceData:是对象真正存储的有效数据。也是在程序代码中所定义的各种类型的字段内容。这部分的存储顺序会受到虚拟机分配策略参数和字段在java源码中定义顺序的影响。

4.Padding:对齐填充并不是必然存在的,它仅仅起着占位符的作用。

Java虚拟机:内存区域

 

对象的访问和定位

Java程序需要通过栈上的reference数据来操作堆上的具体对象。由于reference类型在java虚拟机规范中只规定一个指向对象的引用,并没有定义这个引用应该通过何种方式去定位、访问堆中的对象的具体位置,所以对象访问方式也是取决于虚拟机实现而定的。目前主流的访问方式有句柄和直接指针两种。

1.使用句柄:如果使用句柄访问的话,那么java堆中将会划分一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄包含了对象实例数据与类型数据各自的具体地址信息。

Java虚拟机:内存区域

 

2.直接指针:如果使用直接指针访问,那么java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息。

Java虚拟机:内存区域

 

使用句柄来访问的最大好处就是reference中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要修改。使用直接指针访问的最大好处就是速度更快,它节省了一次指针定位的时间开销。其中类的信息放在方法区,调用方法要知道类的信息。