JVM垃圾收集(GC)算法

时间:2023-01-24 15:15:03

判断对象是否已死

1. 引用计数算法

  • 给对象中添加一个引用计数器,每当一个地方引用它时,计数器值就加1;当引用失败时,计数器值就减1;任何时刻计数器为0的对象就是不能再被使用的。
  • 主流的Java虚拟机里面没有选用引用计数算法来管理内存,其中主要原因是它很难解决对象之间相互循环引用的问题。

2. 可达性分析算法

  • 在Java内主流实现都是通过可达性分析来判断对象是否存活。
  • 基本思路:通过一系列的称为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明这个对象是不可用的。

JVM垃圾收集(GC)算法

  • Java中可以作为GC Roots的对象:
  1. 虚拟机栈(栈帧中的本地变量表)中引用的对象。
  2. 方法区中类静态属于引用的对象。
  3. 方法区中常量引用的对象。
  4. 本地方法栈JNI(即一般说的Native方法)引用的对象。

回收方法区

  • 主要回收两个部分:废弃变量和无用的类。
  • "无用的类":
    1. 该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。
    2. 加载该类的ClassLoader已经被回收。
    3. 该类对应的java.lang.Class对象没有在任何地方被引用,无法再任何地方通过反射访问该类的方法。
  • 虚拟机可以对满足上述3个条件的无用类进行回收,但是仅仅是"可以",并不是和对象一样,不使用了就必然会回收。

垃圾收集算法

1. 标记-清除算法(Mark-Sweep)

  • 算法分为标记和清除两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
  • 不足之处:
    1. 效率问题:标记和清除两个过程的效率都不高。
    2. 空间问题:标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集。

JVM垃圾收集(GC)算法

2. 复制算法(Copying)

  • 将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后将已经使用过的内存空间一次清理掉。
  • 代价:将内存缩小到原来的一半。
  • 现代商业虚拟机都使用这种收集算法来收集新生代:
    1. 将内存分为一块较大的Eden和两块较小的Survivor,每次使用Eden和其中一块Survivor。
    2. 回收时,将Eden和刚才用过的Survivor中还存活着的对象一次性复制到另一块Survivor空间上,最后清除掉Eden和刚才用过的Survivor空间。
    3. HotSpot虚拟机默认Eden和Survivor的大小比例为8:1。
    4. 如果另外一块Survivor空间没有足够的空间存放上一次新生代收集下来的存活对象,这些对象将直接通过分配担保机制进入老年代。

JVM垃圾收集(GC)算法

3. 标记-整理算法(Mark-Compact)

  • 过程仍然与"标记-清除"算法一样,但是后序步骤不是直接对可回收的对象进行清除,而是让所有存活的对象都向一端移动,然后直接清理掉端边界外的内存。

JVM垃圾收集(GC)算法

4. 分代收集算法

  • 当前商业虚拟机都采用分代收集。
  • 一般将Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。
  • 在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。
  • 在老年代中,因为对象存活率高、没有额外的空间对它进行分配担保,就必须使用"标记-清除"或者"标记-整理"算法来进行回收。