[置顶] 虚拟机垃圾回收相关知识整理(JVM GC)

时间:2023-01-02 23:17:51

一、Java内存区域介绍


Java内存区域有如下几部分构成

1、程序计数器:指示的是当前正在执行的机器指令的地址。

2、本地方法栈:通过JNI调用本地方法时根据语言的类型建立相应的栈。

3、Java栈

Java栈是每个线程私有的,每个线程都有一个Java栈,栈中存放着一系列的栈帧(Stack Frame),JVM只能压入(push)和弹出(pop)栈帧这两种操作。每当调用一个方法时,JVM就往栈中压入一个栈帧,方法结束返回时弹出栈帧。如果方法执行时出现异常,可以调用printStackTrace等方法来查看栈的情况。

栈帧由局部变量数组、操作数栈和常量池的引用构成。

局部变量数组中,从0开始按顺序存放方法所属对象的引用、传递给方法的参数、局部变量。

操作数栈:方法执行时的临时空间,其实,操作数栈是方法真正工作的地方,执行方法时,局部变量数组与操作数栈根据方法定义进行数据交换。

常量池的引用:当JVM执行到需要常量池的数据时,就是通过这个引用来访问常量池的。

4、Java堆

堆中存放的是程序创建的对象。这个区域对JVM的性能影响很大。垃圾回收机制处理的正是这一块内存区域。

5、方法区

方法区域时一个JVM实例中的所有线程共享的。它用于存放运行常量池、域和方法的信息、静态变量、类和方法的字节码等。

6、运行常量池

运行常量池:这个区域存放类和接口的常量,除此之外,它还存放方法和域的所有引用。当一个方法或者域被引用的时候,JVM就是通过运行常量池中的这些引用来查找方法和域中内存中的实际地址。

二、Java垃圾收集算法介绍

垃圾回收器GC(Garbage Collection)

  一、引用计数算法(Reference Counting)

  介绍:给对象添加一个引用计数器,每当一个地方引用它时,数据器加1;当引用失效时,计数器减1;计数器为0的即可被回收。

  优点:实现简单,判断效率高

  缺点:很难解决对象之间的相互循环引用(objA.instance = objB; objB.instance = objA)的问题,所以java语言并没有选用引用计数法管理内存

  二、根搜索算法(GC Root Tracing)

  Java和C#都是使用根搜索算法来判断对象是否存活。通过一系列的名为“GC Root”的对象作为起始点,从这些节点开始向下搜索,搜索所有走过的路径称为引用链(Reference Chain),当一个对象到GC Root没有任何引用链相连时(用图论来说就是GC Root到这个对象不可达时),证明该对象是可以被回收的。

  在Java中哪些对象可以成为GC Root?

  • 虚拟机栈(栈帧中的本地变量表)中的引用对象
  • 方法区中的类静态属性引用的对象
  • 方法区中的常量引用对象
  • 本地方法栈中JNI(即Native方法)的引用对象

  [置顶]        虚拟机垃圾回收相关知识整理(JVM GC)

  三、标记-清除算法(Mark-Sweep)

    首先标记出需要回收的对象,在标记完成后统一回收掉所有的被标记对象。

    缺点:效率问题和空间问题(标记清除后会产生大量的不连续内存碎片,内存碎片过多可能会导致程序需要分配较大对象时找不到足够大的连续内存空间而不得不提前触发另一次垃圾回收动作)

    [置顶]        虚拟机垃圾回收相关知识整理(JVM GC)

  四、复制算法(Copying)

    将内存划分为大小相等的两块,每次只使用其中的一块。当这块内存用完了,就将还存活的对象复制到另一块内存上,然后把已使用过的内存空间一次清理掉。

    优点:每次只对其中一块进行GC,不用考虑内存碎片的问题,并且实现简单,运行高效

    缺点:内存缩小了一半

    [置顶]        虚拟机垃圾回收相关知识整理(JVM GC)

    注:现在的商业虚拟机都是用这种收集算法回收新生代。内存分为一块较大的Eden空间和两块较小的Survior空间,每次使用Eden和其中的一块Survior.当回收时,将Eden和Survior中还存活的对象一次性拷贝到另外一块Survior空间上,最后清理Eden和刚才用过的Survior空间。

  五、标记-整理算法(Mark-Compact)

    让所有存活对象都向一端移动,然后直接清理掉端边界以外的所有内存。

    [置顶]        虚拟机垃圾回收相关知识整理(JVM GC)

    六、分代收集算法(Generational Collection)

      根据对象的存活周期的不同将内存划分为几块,一般就分为新生代和老年代,根据各个年代的特点采用不同的收集算法。新生代(少量存活)用复制算法,老年代(对象存活率高)“标记-清理”算法

    补充:分代划分内存介绍

    整个JVM内存总共划分为三代:年轻代(Young Generation)、年老代(Old Generation)、持久代(Permanent Generation)

    1、年轻代:所有新生成的对象首先都放在年轻代内存中。年轻代的目标就是尽可能快速的手机掉那些生命周期短的对象。年轻代内存分为一块较大的Eden空间和两块较小的Survior空间,每次使用Eden和其中的一块Survior.当回收时,将Eden和Survior中还存活的对象一次性拷贝到另外一块Survior空间上,最后清理Eden和刚才用过的Survior空间。

    2、年老代:在年轻代经历了N次GC后,仍然存活的对象,就会被放在老年代中。因此可以认为老年代存放的都是一些生命周期较长的对象。

    3、持久代:基本固定不变,用于存放静态文件,例如Java类和方法。持久代对GC没有显著的影响。持久代可以通过-XX:MaxPermSize=<N>进行设置。

三、垃圾回收

我们都知道,所有通过new创建的对象的内存都在堆中分配,堆被划分为新生代和老年代,新生代又被进一步划分为Eden和Survivor区,而Survivor由FromSpace和ToSpace组成。

新生代:新创建的对象都是用新生代分配内存,Eden空间不足时,触发Minor GC,这时会把存活的对象转移进Survivor区。

老年代:老年代用于存放经过多次Minor GC之后依然存活的对象。

JVM分别对新生代和老年代采用不同的垃圾回收机制。

GC触发条件:Eden区满了触发Minor GC,这时会把Eden区存活的对象复制到Survivor区,当对象在Survivor区熬过一定次数的Minor GC之后,就会晋升到老年代(当然并不是所有的对象都是这样晋升的到老年代的),当老年代满了,就会报OutofMemory异常。

1、新生代的GC(Minor GC)

新生代通常存活时间较短基于Copying算法进行回收,所谓Copying算法就是扫描出存活的对象,并复制到一块新的完全未使用的空间中,对应于新生代,就是在Eden和FromSpace或ToSpace之间copy。新生代采用空闲指针的方式来控制GC触发,指针保持最后一个分配的对象在新生代区间的位置,当有新的对象要分配内存时,用于检查空间是否足够,不够就触发GC。当连续分配对象时,对象会逐渐从Eden到Survivor,最后到老年代。 
在执行机制上JVM提供了串行GC(SerialGC)、并行回收GC(ParallelScavenge)和并行GC(ParNew).

2、老年代的GC(Major GC/Full GC)

老年代与新生代不同,老年代对象存活的时间比较长、比较稳定,因此采用标记(Mark)算法来进行回收,所谓标记就是扫描出存活的对象,然后再进行回收未被标记的对象,回收后对用空出的空间要么进行合并、要么标记出来便于下次进行分配,总之目的就是要减少内存碎片带来的效率损耗。 
在执行机制上JVM提供了串行GC(Serial MSC)、并行GC(Parallel MSC)和并发GC(CMS)。

老年代空间只有在新生代对象转入及创建为大对象、大数组时才会出现不足的现象,当执行Full GC后空间仍然不足,则抛出如下错误: 
java.lang.OutOfMemoryError: Java heap space

因此,Full GC的触发条件如下

1、System.gc() 此方法的调用是建议JVM进行Full GC,虽然只是建议而非一定,但很多情况下它会触发 Full GC,从而增加Full GC的频率,也即增加了间歇性停顿的次数。强烈影响系建议能不使用此方法就别使用,让虚拟机自己去管理它的内存

2、新生代要转入的对象空间大于老年代的剩余空间。

3、要开辟大的对象、大的数组。

四、JVM垃圾收集器介绍

  垃圾回收算法是GC的方法论,垃圾收集器就是内存回收的具体实现。

  一、Serial 收集器

    单线程收集器,在进行GC时,必须暂停所有的工作线程(Stop The World),直到GC收集结束。

    缺点:“Stop The World”给用户带来了不好的体验

    优点:简单而高效,Serial没有其他线程交互的开销,专心做GC可以获得最高的单线程收集效率。

    适用于Client模式下的虚拟机是个很好的选择。

  二、ParNew 收集器

     ParNew收集器就是Serial收集器的多线程版本,适用于Service模式下的新生代收集器。

     ParNew在单核CPU环境中绝对不会有比Serial收集器更好的效果。但是多核CPU,GC效果还是不错的。  

  三、Parallel Scavenge 收集器

    Parallel Scavenge 收集器也是一个新生代收集器,使用复制算法,同时也是一个并行的多线程收集器。

    Parallel Scavenge 收集器的目标则是达到一个可控制的吞吐量。

    注:吞吐量 =用户运行代码时间 / (运行代码时间 + 垃圾收集时间)

    吞吐量高则可以最高效率的利用CPU时间,尽快的完成程序的运算任务,主要适用于后台运算二不需要太多的交互任务。

  四、Serial Old 收集器

    Serial Old 收集器是Serial收集器的老年代版本,单线程收集器,使用“标记-整理”算法。

  五、Parallel Old 收集器

    Parallel Old 收集器是Parallel Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法。

  六、CMS 收集器

    CMS(Concurrent Mark Sweep)收集器是一种以获取最短停顿时间为目标的收集器。目前很大一部分Java应用程序都集中是在互联网或B/S系统的服务器上,这类应用尤其重视服务器的响应速度,希望系统停顿时间最短,给用户最好的体验。整个过程分为四步:

  • 初始标记(CMS initial mark):标记一下GC Root能直接关联到的对象,速度很快;
  • 并发标记(CMS concurrent mark):进行GC Root Tracing的过程
  • 重新标记(CMS remark):修正并发标记期间,因用户程序继续运行导致标记产生变动的那一部分对象的标记记录;
  • 并发清除(CMS concurrent sweep)  

  其中初始标记、重新标记还是需要“Stop The World”.CMS收集器的内存回收过程与用户线程并发执行。

  优点是并发收集、低停顿

  缺点:1)CMS收集器对CPU资源非常敏感;在并发阶段虽然不会导致用户线程停顿,但是会因为占用了一份线程而导致应用程序变慢,总吞吐量降低。

     2)CMS并发清除阶段用户线程还在运行,伴随线程运行产生的新的垃圾出现在标记过程以后,CMS无法在本次收集中处理掉它们,只能留到下次GC。这一部分垃圾就是“浮动垃圾”。

     3)CMS是一款“标记-清除”算法实现的收集器,收集过程会产生大量的空间碎片。空间碎片过多,将会给较大对象无法分配内存,从而触发一次 Full GC.

  七、G1 收集器

    G1(Garbage First)收集器相比于CMS改进有:

    (1)G1基于“标记-整理”算法实现收集器,即它不会产生大量的空间碎片,这对于长时间的应用系统非常重要。

    (2)可以非常准确的控制停顿,既能让使用者明确指定一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不超过N毫秒。G1将Java堆(包括新生代、老年代)划分为多个大小固定独立区域,并且跟踪这些区域里面的垃圾堆积程度,在后台维护一个优先列表,每次根据允许的收集时间,优先回收垃圾最多的区域。

参考资料:http://blog.csdn.net/u010412719/article/details/52175255
http://www.cnblogs.com/parryyang/p/5748793.html