Java程序执行过程及内存机制

本讲将介绍Java代码是如何一步步运行起来的，其中涉及的编译器，类加载器，字节码校验器，解释器和JIT编译器在整个过程中是发挥着怎样的作用。此外还会介绍Java程序所占用的内存是被如何管理的：堆、栈和方法区都各自负责存储哪些内容。最后用一小块代码示例来帮助理解Java程序运行时内存的变化。

Java程序执行过程

步骤 1： 写源代码，源代码将以.java的文件格式保存在电脑硬盘中。
步骤 2： 编译器（compiler）检查是否存在编译期错误（例如缺少分号，关键字拼写错误等）。若通过检测，编译器就会将源代码翻译成字节码（bytecode），以.class的文件格式保存在电脑硬盘中。
步骤 3： 若要运行此Java程序，JVM中会有一个叫类加载器（class loader）的内置程序把字节码从硬盘载入到正位于内存中的JVM里去。
步骤 4： JVM中还有一个叫字节码校验器（bytecode verifier）的内置程序检测是否存在运行期错误（例如栈溢出）。若通过检测，字节码校验器就会将字节码传递给解释器（interpreter）。
步骤 5： 解释器会对字节码进行逐行翻译，将其翻译成当前所在系统可以理解的机器码（machine code），
步骤 6：将机器码交给操作系统，操作系统会以main方法作为入口开始执行程序。至此，一个Java程序就这样运行起来了。

细心的读者可能注意到了，在流程图中还涉及到一个叫JIT的东西在步骤中没有被解释。那么JIT编译器（Just-In-Time Compiler）是如果参与进程序的执行过程中呢？让我们来看以下两个例子。

情况 1： 解释器对代码进行逐行解释，正如我们在步骤中所介绍的。
情况 2： 这是JIT编译器参与进Java执行过程的情况，JIT编译器会扫描所有代码并对其进行优化。例如此时它发现最后一行代码是重复多余的，就会将其移除，只传递前4行代码给解释器。这样解释器就能运行地更快速高效，毕竟少了一行多余的代码需要翻译。

当然，这只是JIT编译器的优化手段之一，不同公司设计的JIT编译器对Java程序的运行会有不同的优化方式。此外需要知道的是，JIT编译器并不是每次都会参与到执行过程中来。

内存机制

在步骤3中我们谈到字节码会被类加载器载入到内存，那么载入之后JVM是如何对其进行内存管理的呢？

通常，在载入内存后，一个Java程序所占用的内存会被大致分为3块区域：堆（heap），栈（stack）和方法区（method area）。

堆：存放new出来的东西。

栈：存放局部变量。

方法区：类型信息，字段信息，常量池（constant pool），静态变量，方法信息等。

public final class Student extends Object implements Serializable { // 1.类信息

    // 2.对象字段信息

    private String name;

    private int score;

    // 3.常量池

    public final int id = 0;

    public final String gender = "male";

  	// 4.静态变量

  	public static int a = 0;

    // 5.方法信息

    public int getid() {

        return id;

    }

}

PC寄存器：存放将要执行的指令的地址。（因为机器的脑子不灵活，所以需要一块专门的区域帮他记住执行到哪一步，不然它会忘记）

本地方法栈：与JVM栈所发挥的作用是非常相似的，其区别不过是JVM栈为Java方法服务，而本地方法栈则是为使用到的Native方法服务。有的虚拟机（例如Sun HotSpot虚拟机）甚至直接就把本地方法栈和虚拟机栈合二为一。

每个线程拥有各自独立的（虚拟机）栈、PC寄存器和本地方法栈。而堆和方法区则是所有线程共享的。

最后让我们通过一个小例子来理解Java程序执行时内存的变化。

public class Person {

  int id;

  int age;

  Person(int id1, int age1) {

    id = id1;

    age = age1;

  }

  public static void main(String[] args) {

		Person Tom = new Person(1, 25);

  }

}

首先，在stack中申请了一块内存，这块内存区域名字叫Tom，此时区域里存储的内容为null。

接着，调用Person的构造方法，方法的参数属于局部变量，因此在stack中有两块区域分别存放id1和age1。

通过构造方法，可以new出来一个Person的对象，这个对象连带着其成员变量会被存放在heap中。成员变量id和age的值由存放在stack中的局部变量id1和age1赋予。

最后，将这个对象的引用值（类似于地址）传递给Tom，通过引用值我们就可以找到这个对象。

（注意：位于stack中的id1和age1会随着构造方法调用的结束而消失，这里为了更好地表现全过程，因此保留在图中。）

关于栈和堆的其他小知识

栈和堆的大小都是固定为一个默认值的，它们作为jvm的参数设定好了，不同的jvm设定的参数不同，相应的栈和堆的大小也就不同。
栈是运行时的单位：里面存储的信息都是跟当前线程相关的，包括局部变量、程序运行状态、方法返回值等；而堆是存储的单位：它只负责存储对象。
当一个方法调用结束后，方法里的局部变量会随之消失，不会在stack中继续占用空间。
栈与堆的分离使得不同线程可以访问同一个对象，这是一种有效的数据交互方式（共享内存）；此外也节省了空间，因为堆中的共享常量和缓存可以被所有栈访问。

参考

有问题欢迎大家在评论区留言，转载请注明出处。

秒客网

Java程序执行过程及内存机制