前言
10月4号就要举办和璐璐的婚礼了,为了督促自己,准备8月份利用一个月晚上的业务时间来学习Java虚拟机的知识。
参考的是周志明写的《深入理解Java虚拟机》。
运行时的数据区域
初学Java时,估计很多人都跟我一样,将Java的内存模型划分为:
- 栈区
- 堆区
- 字符串常量区
并非说这种区分方法是错误的,而是说这种区分方法过于笼统,纯粹是为了方便记忆。真要深入了解Java语言,那我们就应该清楚的知道,Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为如下几个区域:
Program Counter Register
Program Counter Register(程序计数器)是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
在Java中,每条线程需要有自己独立的程序计数器,所以我们称Program Counter Register为线程私有内存。
VM Stack
VM Stack(虚拟机栈)和程序计数器一样,也是线程私有的。
VM Stack描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
局部变量表
局部变量表存放了编译期可知的各种基本数据类型(boolean,byte,short,int,long,float,double,char)、对象引用(reference类型,它不等同于对象本身,它可能是一个指向对象起始地址的引用指针)和returnAddress类型(指向了一条字节码指令地址)。
在Java虚拟机中,对VM Stack区域规定了两种异常情况:
- 如果线程所请求的栈深度大于虚拟机规定的栈深度,将抛出* Error异常。
- VM Stack在动态扩展时无法申请到足够的内存,就会抛出OutOfMemory Error异常。
Heap
对于大多数应用来说,Heap(堆)是Java虚拟机管理内存最大的一块。和Program Counter Register与VM Stack不同,Heap是所有线程共享的内存区域,在Java虚拟机启动时创建。
Heap堆唯一的目的就是:存放对象实例,几乎所有的对象实例都在这里分配内存。
根据Java虚拟机规范规定,Heap可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。目前主流虚拟机控制Heap大小都是通过-Xmx和-Xms参数来控制的。如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。
Method Area
Method Area(方法区)与Java Heap一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入Method Area的Runtime Constant Pool中存放。
对象探秘
以常用的虚拟机HotSpot和常用的内存区域Java堆为例,探讨一下HotSpot虚拟机在Java堆中对象分配、布局和访问的全过程。
对象的创建
在语言层面,创建对象通常仅仅是一个new关键字而已,但是,在虚拟机中,对象的创建过程是怎么样的呢?
虚拟机遇到一个new指令的时候,会执行如下过程:
- 检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。
- 类加载检查通过后,接下来虚拟机将为新生对象分配内存。
单独介绍一下为对象分配内存的过程。
- 假设Java堆中的内存是绝对规整的,所有用过的内存都放在一边,空间的内存放在另一边,中间放着一个指针为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲那边挪动一段与对象大小相等的距离,这种分配方式称为“指针碰撞”(Bump the Pointer)。
- 如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”(Free List)。
选择那种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定的。
- 接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例等。
对象的内存布局
在HotSpot虚拟机中,对象在内存中存储的布局可以分为三块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。
暂时省略部分我看不懂的内容
对象的访问定位
建立对象就是为了使用对象,我们的Java程序需要通过栈上的reference数据来操作堆上的具体对象。目前如何通过reference定位到具体的对象位置也是由虚拟机实现决定的,目前主流的方式有两种:
- 使用句柄
- 直接指针
使用句柄访问的话,那么Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。如下图所示:
如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址。如下图所示:
这两种对象访问方式各有优势:
- 使用句柄来访问的最大好处就是reference中存储的是稳定的句柄地址,而对象被移动(GC时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要修改。
- 使用直接指针访问的最大好处就是速度更快,它节省了一次指针定位的时间开销。由于对象的访问在Java中非常频繁,因此这类开销积少成多后也是一项非常可观的执行成本。