(一)线程------JVM体系结构与内存模型概要

时间:2022-08-10 09:03:25

简述:

    为了彻底搞清楚线程问题,特写此系列文章记录之。这一些列文章将讲述JVM的体系结构以及涉及线程相关的JVM的运行时数据区来引出Java内存模型,Java通信原理将描述线程间数据通信存在的问题以及线程同步的重要性。Java线程状态讲述线程的基本知识。Java线程锁机制讲述线程同步机制的解决办法。

JVM体系结构

                  (一)线程------JVM体系结构与内存模型概要

    类加载器:
    每一个被JVM装载的类型都有一个与之对应的Java.lang.Class类的实例来表示该类型。该实例可以唯一表示被jvm装载的class类,这个实例和其他类的实例一样放在堆内存中。

    执行引擎 :
    执行引擎相当于线程,是JVM的核心,执行引擎的作用就是解析JVM字节码指令,得到执行的结果。执行引擎由各个厂家实现。SUN的hotspot是一种基于栈的执行引擎。而Android的Dalvik是基于寄存器的执行引擎。执行引擎也就是执行一条条代码的一个流程,代码都包含在方法体中,执行引擎本质上就是执行一个个方法串起来的流程,对应于操作系统的一个线程,每个java线程就是一个执行引擎的实例。
    Java虚拟机的主要任务就是装在class文件并执行相应的字节码文件。从JVM体系结构图中我们看出:一个JVM实例由类装载器、运行时数据区以及执行引擎所构成。一个Java程序的执行流程为:首先Java源代码文件(.java后缀)会被Java编译器编译为字节码文件(.class后缀),然后由JVM中的类加载器加载各个类的字节码文件,加载完毕之后,交由JVM执行引擎执行。那么本系列不会讲解类加载器,主要围绕运行时数据区讲解线程相关问题。所以接下来我们就来了解一下运行时数据区(就是JVM内存)。

Java内存模型
    Java代码是运行在Java虚拟机之上的,由Java虚拟机通过解释执行(解释器)或编译执行(即时编译器)来完成,故Java内存模型,也就是指Java虚拟机的运行时内存模型。 OK,我们通过一张图进一步了:
                       (一)线程------JVM体系结构与内存模型概要

    程序计数器:

        程序计数器(Program Counter Register),也有称作为PC寄存器。想必学过汇编语言的朋友对程序计数器这个概念并不陌生,在汇编语言中,程序计数器是指CPU中的寄存器,它保存的是程序当前执行的指令的地址(也可以说保存下一条指令的所在存储单元的地址),当CPU需要执行指令时,需要从程序计数器中得到当前需要执行的指令所在存储单元的地址,然后根据得到的地址获取到指令,在得到指令之后,程序计数器便自动加1或者根据转移指针得到下一条指令的地址,如此循环,直至执行完所有的指令。
  虽然JVM中的程序计数器并不像汇编语言中的程序计数器一样是物理概念上的CPU寄存器,但是JVM中的程序计数器的功能跟汇编语言中的程序计数器的功能在逻辑上是等同的,也就是说是用来指示执行哪条指令的。
  由于在JVM中,多线程是通过线程轮流切换来获得CPU执行时间的,因此,在任一具体时刻,一个CPU的内核只会执行一条线程中的指令,因此,为了能够使得每个线程都在线程切换后能够恢复在切换之前的程序执行位置,每个线程都需要有自己独立的程序计数器,并且不能互相被干扰,否则就会影响到程序的正常执行次序。因此,可以这么说,程序计数器是每个线程所私有的
  在JVM规范中规定,如果线程执行的是非native方法,则程序计数器中保存的是当前需要执行的指令的地址;如果线程执行的是native方法,则程序计数器中的值是undefined。
  由于程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变,因此,对于程序计数器是不会发生内存溢出现象(OutOfMemory)的。

   虚拟机栈

  虚拟机栈(Java Vitual Machine Stack),也就是我们常常所说的栈,跟C语言的数据段中的栈类似。事实上,Java栈是Java方法执行的内存模型。为什么这么说呢?下面就来解释一下其中的原因。
  Java栈中存放的是一个个的栈帧,每个栈帧对应一个被调用的方法,在栈帧中包括局部变量表(Local Variables)、操作数栈(Operand Stack)、指向当前方法所属的类的运行时常量池的引用(Reference to runtime constant pool)、方法返回地址(Return Address)和一些额外的附加信息。当线程执行一个方法时,就会随之创建一个对应的栈帧,并将建立的栈帧压栈。当方法执行完毕之后,便会将栈帧出栈。因此可知,线程当前执行的方法所对应的栈帧必定位于Java栈的顶部。讲到这里,大家就应该会明白为什么在使用递归方法的时候容易导致栈内存溢出(*Error)的现象了以及为什么栈区的空间不用程序员去管理了(当然在Java中,程序员基本不用关系到内存分配和释放的事情,因为Java有自己的垃圾回收机制),这部分空间的分配和释放都是由系统自动实施的。对于所有的程序设计语言来说,栈这部分空间对程序员来说是不透明的。虚拟机栈也是线程私有的。

    本地方法栈 :
  本地方法栈与Java栈的作用和原理非常相似。区别只不过是Java栈是为执行Java方法服务的,而本地方法栈则是为执行本地方法(Native Method)服务的。在JVM规范中,并没有对本地方发展的具体实现方法以及数据结构作强制规定,虚拟机可以*实现它。在HotSopt虚拟机中直接就把本地方法栈和Java栈合二为一。 本地方法栈也是线程私有的。

    堆 :
  在C语言中,堆这部分空间是唯一一个程序员可以管理的内存区域。程序员可以通过malloc函数和free函数在堆上申请和释放空间。那么在Java中是怎么样的呢?
  Java中的堆是用来存储对象本身的以及数组(当然,数组引用是存放在Java栈中的)。只不过和C语言中的不同,在Java中,程序员基本不用去关心空间释放的问题,Java的垃圾回收机制会自动进行处理。因此这部分空间也是Java垃圾收集器管理的主要区域。另外, 堆是被所有线程共享的,在JVM中只有一个堆。

   方法区 :
  方法区在JVM中也是一个非常重要的区域,它与堆一样,是被 线程共享的区域。在方法区中,存储了每个类的信息(包括类的名称、方法信息、字段信息)、静态变量、常量以及编译器编译后的代码等。
  在Class文件中除了类的字段、方法、接口等描述信息外,还有一项信息是常量池,用来存储编译期间生成的字面量和符号引用。 运行时常量池是一个非常重要的部分,它是每一个类或接口的常量池的运行时表示形式,在类和接口被加载到JVM后,对应的运行时常量池就被创建出来。当然并非Class文件常量池中的内容才能进入运行时常量池,在运行期间也可将新的常量放入运行时常量池中,比如String的intern方法。
  在JVM规范中,没有强制要求方法区必须实现垃圾回收。很多人习惯将方法区称为“永久代”,是因为HotSpot虚拟机以永久代来实现方法区,从而JVM的垃圾收集器可以像管理堆区一样管理这部分区域,从而不需要专门为这部分设计垃圾回收机制。不过自从JDK7之后,Hotspot虚拟机便将运行时常量池从永久代移除了。

   结论:
     (1)线程私有区,包含以下3类:
             程序计数器,记录正在执行的虚拟机字节码的地址;
             虚拟机栈:方法执行的内存区,每个方法执行时会在虚拟机栈中创建栈帧;
             本地方法栈:虚拟机的Native方法执行的内存区;
    (2)线程共享区,包含以下2类
            Java堆:对象分配内存的区域;
            方法区:存放类信息、常量、静态变量、编译器编译后的代码等数据;
            常量池:存放编译器生成的各种字面量和符号引用,是方法区的一部分。
    通过上述的描述,我们把内存模型图进一步细分如下:
                 (一)线程------JVM体系结构与内存模型概要