《深入理解Java虚拟机》学习笔记(第二章 Java内存区域与内存溢出异常)

时间:2022-11-06 00:43:00

第二章 Java内存区域与内存溢出异常

Java与C++之间有一堵由内存动态分配和垃圾收集技术所围成的“高墙”,墙外面的人想进去,墙里面的人想出来。

对于从事C、C++程序开发的开发人员来说,在内存管理领域,他们既是拥有最高权力的“皇帝”又是从事最基础工作的
“劳动人民”——既拥有每一个对象的“所有权”,又担负着每一个对象生命开始到终结的维护责任。

运行时数据区域

  1. 程序计数器
    • 是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。

    • Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,
      一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。
      因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,
      各条线程之间计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。

    • 如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;
      如果正在执行的是Native方法,这个计数器值则为空(Undefined)。
      此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。

  2. Java虚拟机栈
    • 同程序计数器一样,是线程私有的,生命周期与线程相同。

    • 虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、
      动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机中入栈到出栈的过程。

    • 局部变量表:
      • 存放了编译期可知的各种基本数据类型、对象引用和returnAddress类型。
      • 其所需的内存空间在编译期间完成分配,在方法运行期间不会改变局部变量表的大小。
    • 线程请求的栈深度>虚拟机所允许的深度:*Error
    • 虚拟机栈可以动态扩展时,如果扩展时无法申请到足够的内存:OutOfMemoryError

  3. 本地方法栈
    • 类似Java虚拟机栈,虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,
      而本地方法栈则为虚拟机使用到的Native方法服务。Sun HotSpot将二者合二为一。
  4. Java堆
    • 是Java虚拟机所管理的内存中最大的一块,是被所有线程共享的一块内存区域,在虚拟机启动时创建。

    • 此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。

    • Java堆是垃圾收集器管理的主要区域,很多时候被称为“GC堆”。

    • 可进一步划分来更好地回收内存或者更快地分配内存:
      • 内存回收角度(分代收集算法):新生代、老生代。
      • 内存分配角度:划分出多个线程私有的分配缓冲区(TLAB)。
    • Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像磁盘空间一样。

    • 如果在堆中没有内存完成实例分配,并且堆无法再扩展:OutOfMemoryError。

  5. 方法区
    • 是各个线程共享的内存区域,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

    • HotSpot虚拟机把GC分代收集扩展至方法区,使用永久代来实现方法区。

    • 方法区无法满足内存分配需求时:OutOfMemoryError。

  6. 运行时常量池
  7. 直接内存

HotSpot虚拟机对象探秘

  1. 对象的创建:
    • 检查:
      • 虚拟机遇到new指令时,首先检查这个指令的参数是否能在常量池中定位到一个类的符号引用,
        并且检查这个符号引用所代表的类是否已被加载、解析和初始化过。如果没有,要先执行相应的类加载过程。
    • 内存分配:
      • 对象所需内存的大小在类加载完成后便可完全确定,为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。

      • 垃圾收集器是否带有压缩整理功能?Java堆中内存是否规整?
        Δ 是:指针碰撞:一个指针作为已用内存和空闲内存分界点的指示器。(如Serial、ParNew等带Compact过程的收集器)
        Δ 否:空闲列表:虚拟机维护列表记录可用内存块。(如CMS这种基于Mark-sweep算法的收集器)

      • 并发下线程安全问题?
        Δ 虚拟机采用CAS+失败重试的方式保证更新操作的原子性。(CAS:Compare and Swap 乐观锁思想的一种实现方式)
        (乐观锁:多线程更新同一变量时,一个成功,其余被告知失败)
        附:Java并发问题--乐观锁与悲观锁以及乐观锁的一种实现方式-CAS
        Δ 把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,TLAB。

    • 初始化零值:
      • 保证对象的实例字段在Java代码中可以不赋初始值就直接使用。
    • 设置对象:
      • 此时,从虚拟机的视角看,一个新的对象已经产生了,但从Java程序的视角看,对象创建才刚刚开始。
  2. 内存的对象布局:
    • 对象头:
      • 对象自身的运行时数据:
        如哈希码、GC分代年龄、锁状态标志等。

      • 类型指针:
        即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

        附:查找对象的元数据信息并不一定要经过对象本身。

      • 如果对象是Java数组,对象头中要有记录数组长度的数据。(从数组的元数据中无法确定数组大小)

    • 实例数据:
      • 对象真正存储的有效信息。

      • 相同宽度的字段总是被分配到一起,然后父类中定义的变量会出现在子类之前。

    • 对齐填充:
      • 占位符,HotSpot VM的自动内存管理系统要求对象的起始地址必须是8字节的整数倍。
  3. 对象的访问定位:
    • Java程序需要通过栈上的reference数据来操作堆上的具体对象。

    • 句柄访问:
      • Java堆中划分一块内存作为句柄池,reference中存储的是对象的句柄地址,
        句柄中包含了对象实例数据与类型数据各自的具体地址信息。更稳定(在对象被移动时只改变句柄中的实例数据指针)。
    • 直接指针访问:
      • reference中存储的是对象地址。速度更快(节省了一次指针定位的时间开销)。