jvm JAVA GC之标记

堆分为年轻代和年老代。永久代是非堆内存，它又叫做方法区（一般的说法），主要存储已被加载的类信息、常量、静态变量。而该区域在java8已被删除，取而代之的是元空间，我会在后面的章节细讲。

什么是标记？怎么标记？

第一个问题相信大家都知道，标记就是对一些已死的对象打上记号，方便垃圾收集器的清理。至于怎么标记，一般有两种方法：引用计数和可达性分析。

引用计数实现起来比较简单，就是给对象添加一个引用计数器，每当有一个地方引用它时就加1，引用失效时就减1，当计数器为0的时候就标记为可回收。这种判断效率很高，但是很多主流的虚拟机并没有采用这种方法，主要是因为它很难解决几个对象之间循环引用的问题，像下图这个例子这样发生循环引用。虽然不怎么用了，但还是值得我们学习！

可达性分析的基本思路就是：通过将一些称为”GC Roots”的对象作为起始点，从这些节点开始搜索，搜索和该节点发生直接或者间接引用关系的对象，将这些对象以链的形式组合起来，形成一张“关系网”，又叫做引用链。最后垃圾收集器就回收那些不在这张关系网上的对象。如图：

jvm JAVA GC之标记

连接GC Roots对象的object是确定还存活的对象，而右边的die obj由于和GCROOTS没有关系，所以会标记为可回收的对象。目前主流的商用虚拟机用的都是类似的方法。那什么对象才能作为“GC Roots”呢？在java中，有四种对象可以作为“GC Roots”

栈帧（第一章的名词）中的引用对象。（栈中的）
静态属性引用的对象。（方法区中的）
常量引用的对象。（方法区中的）
本地方法栈中JNI引用的对象。（本地方法栈中的）

目前来说这两种标记的方法最为常用，带标记完成后就可以进行上一章所讲的回收方法了！

鲜为人知的二次标记

我们讲到了标记，但是不是被标记了就肯定会被回收呢？不知道小伙伴们记不记得Object类有一个finalize()方法，所有类都继承了Object类，因此也默认实现了这个方法。

这个方法的用途就是：在该对象被回收之前，该对象的finalize()方法会被调用。这里的回收之前指的就是被标记之后，问题就出在这里，有没有一种情况就是原本一个对象开始不在上一章所讲的“关系网”（引用链）中，但是当开发者重写了finalize()后，并且将该对象重新加入到了“关系网”中，也就是说该对象对我们还有用，不应该被回收，但是已经被标记啦，怎么办呢？

针对这个问题，虚拟机的做法是进行两次标记，即第一次标记不在“关系网”中的对象。第二次的话就要先判断该对象有没有实现finalize()方法了，如果没有实现就直接判断该对象可回收；如果实现了就会先放在一个队列中，并由虚拟机建立的一个低优先级的线程去执行它，随后就会进行第二次的小规模标记，在这次被标记的对象就会真正的被回收了。我们来看下面的代码：

嘿嘿，其实面对同一个对象，他的finalize()方法只会被调用一次，因此第一次调用的时候会进行finalize()方法，并且成功的将该对象加入了“关系网”中，但当第二次回收的时候并不会进入，所以第二次不能将对象加入“关系网”中，导致被回收了。

图中有一行让程序睡眠一秒钟的代码，为的就是确保让低优先级的执行finalize()方法线程执行完成。那如果我们把他注释了会怎样呢？输出结果是：

很奇怪吧，不过如果执行很多次的话，也会出现最开始那样的结果，但多数会是这个结果。因为我们已经说了，执行finalize()的是一个低优先级的线程，既然是一个新的线程，虽然优先级低了点，但也是和垃圾收集器并发执行的，所以垃圾收集器没必要等这个低优先级的线程执行完才继续执行。也就是说，finalize()方法不一定会在对象第一次标记后执行。用一句清晰易懂的话来说就是：虚拟机确实有调用方法的动作，但是不会确保在什么时候执行完成。因此也就出现了上面输出的结果，对象被回收之后，那个低优先级的线程才执行完。

秒客网

jvm JAVA GC之标记

什么是标记？怎么标记？

鲜为人知的二次标记

相关文章