想买保时捷的运维李先生学Java性能之 垃圾收集器
前言
垃圾收集算法是内存回收的方法论;垃圾收集器是内存回收的具体实现。Java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同的厂商、不同版本的虚拟机所提供的垃圾收集器都有很大的差别,并且一般都会提供参数供用户根据自己的应用特点和要求组合出各个年代所使用的收集器。
虚拟机里并不是使用一个收集器,而是很多收集器搭配使用,在不同的年代使用不同的收集器。
一、Serial收集器
Serial收集器是最基本、发展历史最悠久的收集器、曾经是虚拟机新生代收集的唯一选择。这个收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在他进行垃圾收集时,必须暂停其他所有的工作线程,直到他收集结束。“Stop-The-World”这项工作实际是是由虚拟机在后台自动发起和自动完成的,在用户不可见的情况下把用户正常工作的线程全部停掉,这是比较难以接受的。
二、ParNew收集器
ParNew收集器就是Serial收集器的多线程版本,处理使用多条线程进行垃圾收集之外,其余行为包括Serail收集器可用的所有控制参数(例如:-XX:SurvivorRatio、-XX:PretenureSizeThreshold、-XX:HandlePromotionFailure等)、收集算法、Stop the World、对象分配规则、回收策略等都与Serail收集器完全一致,在实现上,两者也共用了很多代码。
ParNew收集器除了多线程收集之外,其他与Serial收集器相比并没有多大的创新之处,但它却是许多运行在Server模式下的虚拟机中首选的新生代收集器,其中有一个与性能无关但很重要的原因是,除了Serial收集器外,目前只有它能与CMS收集器配合工作。
三、Paraller Scanvenge收集器
Paraller Scanvenge收集器是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集器。
Paraller Scanvenge收集器的特点是它的关注点与其他收集器不同,CMS等收集器的关注点是尽可能的缩短垃圾收集器收集时用户现程的停顿时间,而Paraller Scavenge收集器的目标这是达到一个可控制的吞吐量(Throughput)。所谓吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值。即吞吐量=运行用户代码时间/(运行用户代码时间 + 垃圾收集时间)。
停顿时间越短越适合需要与用户交互的程序,良好的响应速度能提升用户体验,而高吞吐量则可以高效率的利用CPU时间,尽快的完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
parallel Scavenge收集器提供了两个参数用于精确控制吞吐量,分别是控制最大垃圾收集器停顿时间的-XX:MaxGCPauseMillis参数以及直接设置吞吐量大小的-XX:GCTimeRatio参数。
MaxGCPauseMillis 参数允许的值是一个大于0的毫秒数,收集器将尽可能地保证内存回收花费的时间不超过设定值。
GCTimeRatio参数的值应当是一个大于0且小于100的整数,也就是垃圾收集时间占比总时间的比率。
注:
并行(Paraller):指多条来及收集线程并行工作,但此用户线程仍然处于等待状态
并发(Concurrent):值用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续运行,而垃圾收集程序运行在另一个CPU上。
4、Serial Old收集器
Serial Old 收集器是Serial 收集器的老年代版本,它同样是一个单线程收集器,使用“标记-整理”算法。这个收集器的主要意义也是在与Client模式下的虚拟机使用。如果在Server模式下,那么他还有两大用途,一是在JDK1.5以及之前的版本中与Paraller Scavenge收集器搭配使用,另一种用途是做为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用。
五、parallel Old 收集器
Paraller Old收集器是Paraller Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法。
6、CMS收集器
CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。CMS收集器是基于“标记-清除”算法实现的,它的运作过程分为4个步骤:
1)初始标记(CMS initial mark)
2)并发标记(CMS concurrent mark)
3)重新标记(CMS remark)
4)并发清除(CMS concurrent sweep)
其中,初始标记和重新标记这两个步骤仍然需要“Stop the World”(停止工作线程)。初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快。并发标记阶段就是进行GC Roots Tracing的过程,而重新标记阶段则是为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短。
七、G1(Garbage-First)收集器
G1(Garbage-First)收集器是一款面向服务端应用的垃圾收集器。如果不计算维护Remembered Set的操作,G1收集器的运作大致可以分为以下几个步骤:
1)初始标记(Initial Marking)
2)并发标记(Concurrent Marking)
3)最终标记(Final Marking)
4)筛选回收(Live Data Counting and Evacuation)