JUC高级四:Java内存模型之JMM

时间:2022-07-09 01:08:08

JUC高级四:Java内存模型之JMM

1. 计算机硬件存储体系(JMM为什么诞生)

JUC高级四:Java内存模型之JMM

JUC高级四:Java内存模型之JMM

因为有这么多级的缓存(cpu和物理主内存的速度不一致的),CPU的运行并不是直接操作内存而是先把内存里边的数据读到缓存,而内存的读和写操作的时候就会造成不一致的问题

在我们cpu寄存器和内存之间加上高速缓存来平衡寄存器的存储速度远大于内存的存储速度的问题

Java虚拟机规范中试图定义一种Java内存模型(java Memory Model,简称JMM) 来屏蔽掉各种硬件和操作系统的内存访问差异,
以实现让Java程序在各种平台下都能达到一致的内存访问效果。推导出我们需要知道JMM

2. Java内存模型Java Memory Model

JMM(Java内存模型Java Memory Model,简称JMM)本身是一种抽象的概念并不真实存在仅仅描述的是一组约定或规范,通过这组规范定义了程序中(尤其是多线程)各个变量的读写访问方式并决定一个线程对共享变量的写入何时以及如何变成对另一个线程可见,关键技术点都是围绕多线程的原子性可见性有序性展开的。

2.1 能干嘛?

  1. 通过JMM来实现线程和主内存之间的抽象关系。
  2. 屏蔽各个硬件平台和操作系统的内存访问差异以实现让Java程序在各种平台下都能达到一致的内存访问效果。

3.JMM规范下三大特性

3.1 可见性

是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更 ,JMM规定了所有的变量都存储在主内存中。

JUC高级四:Java内存模型之JMM

3.1.1 线程脏读问题

Java中普通的共享变量不保证可见性,因为数据修改被写入内存的时机是不确定的,多线程并发下很可能出现"脏读",所以每个线程都有自己的工作内存,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取,赋值等 )都必需在线程自己的工作内存中进行,而不能够直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成

JUC高级四:Java内存模型之JMM

个人总结:Java中普通的共享变量不保证可见性,假设在多线程情况下,每个线程启动时都会从主内存拷贝一份共享变量副本到自己线程私有的内存中,但由于变量数据在线程之间不可见,线程一修改了自己线程内的副本变量或者主内存中的变量,对线程二是不可见的,线程二任然使用的是自己线程的副本变量

我们想要线程一修改自己线程内的副本变量或者主内存中的变量时让线程二可见这就是可见性

3.2 原子性

指一个操作是不可中断的,即多线程环境下,操作不能被其他线程干扰

3.3 有序性

3.3.1 指令重排

对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。但为了提升性能编译器和处理器通常会对指令序列进行重新排序。Java规范规定JVM线程内部维持顺序化语义,即只要程序的最终结果与它顺序化执行的结果相等,那么指令的执行顺序可以与代码顺序不一致,此过程叫指令的重排序

指令重排可以保证串行语义一致,但没有义务保证多线程间的语义也一致,即可能产生"脏读",简单说:两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序会被优化

从源码到最终执行示例图:

JUC高级四:Java内存模型之JMM

单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。
处理器在进行重排序时必须要考虑指令之间的数据依赖性
多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测,所以有时候我们会根据特殊场景业务禁止指令重排从而保证程序执行的有序性

4. JMM规范下,多线程对变量的读写过程

读取过程:
由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到的线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存中存储着主内存中的变量副本拷贝,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成,其简要访问过程如下图:

JUC高级四:Java内存模型之JMM

总结:

  • 我们定义的所有共享变量都储存在物理主内存中
  • 每个线程都有自己独立的工作内存,里面保存该线程使用到的变量的副本(主内存中该变量的一份拷贝)
  • 线程对共享变量所有的操作都必须先在线程自己的工作内存中进行后写回主内存,不能直接从主内存中读写(不能越级)
  • 不同线程之间也无法直接访问其他线程的工作内存中的变量,线程间变量值的传递需要通过主内存来进行**(同级不能相互访问)**

5. JMM规范下,多线程先行发生原则之happens-before

在JMM中,如果一个操作执行的结果需要对另一个操作可见性或者代码重排序那么这两个操作之间必须存在happens-before关系。

5.0 先行发生原则作用

  • 如果Java内存模型中所有的有序性都仅靠volatile和synchronized来完成,那么有很多操作都将会变得非常啰嗦,但是我们在编写Java并发代码的时候并没有察觉到这一点。

  • 我们没有时时、处处、次次,添加volatile和synchronized来完成程序,这是因为Java语言中JMM原则下有一个“先行发生”(Happens-Before)的原则限制和规矩

  • 它是判断数据是否存在竞争,线程是否安全的非常有用的手段。依赖这个原则,我们可以通过几条简单规则一揽子解决并发环境下两个操作之间是否可能存在冲突的所有问题,而不需要陷入Java内存模型苦涩难懂的底层编译原理之中。

5.1 示例1

JUC高级四:Java内存模型之JMM

5.2. happens-before总原则(面试回答)

  1. 如果一个操作happens-before另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前。(这不就是依赖性吗?对某个操作有依赖,肯定先执行依赖啊)
  2. 两个操作之间存在happens-before关系,并不意味着一定要按照happens-before原则制定的顺序来执行。如果重排序之后的执行结果与按照happens-before关系来执行的结果一致,那么这种重排序并不非法。

5.3. happens-before之8条

5.3.1 次序规则

一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作;(前一个操作的结果可以被后续的操作获取。)

5.3.2 锁定规则

一个unLock操作先行发生于后面((这里的“后面”是指时间上的先后))对同一个锁的lock操作;(对于同一把锁objectLock,threadA一定先unlock同一把锁后B才能获得该锁, A 先行发生于B)

5.3.3 volatile变量规则

对一个volatile变量的写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的,这里的“后面”同样是指时间上的先后。

5.3.4 传递规则

如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C;

5.3.5 线程启动规则(Thread Start Rule)

Thread对象的start()方法先行发生于此线程的每一个动作

5.3.6 线程中断规则(Thread Interruption Rule)

对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生;

可以通过Thread.interrupted()检测到是否发生中断

5.3.7 线程终止规则(Thread Termination Rule)

线程中的所有操作都先行发生于对此线程的终止检测,

我们可以通过Thread::join()方法是否结束、Thread::isAlive()的返回值等手段检测线程是否已经终止执行。

5.3.8 对象终结规则(Finalizer Rule)

一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始

(对象没有完成初始化之前,是不能调用finalized()方法的)

5.4 示例2

JUC高级四:Java内存模型之JMM

5.4.1 优化方式1:把getter/setter方法都定义为synchronized方法

虽然解决了线程安全的问题,但是读和写的并发量都下降了

JUC高级四:Java内存模型之JMM

5.4.2 (推荐)优化方式2:把value定义为volatile变量,由于setter方法对value的修改不依赖value的原值,满足volatile关键字使用场景

JUC高级四:Java内存模型之JMM

5.5 happens-before总结

  • 在Java 语言里面,Happens-Before 的语义本质上是一种可见性
  • A Happens-Before B意味着A发生过的事情对B来说是可见的,无论A事件和B事件是否发生在同一个线程里.
  • JMM的设计分为两部分:
    一部分是面向我们程序员提供的,也就是happens-before规则,它通俗易懂的向我们程序员阐述了一个强内存模型,我们只要理解happens-before规则,就可以编写并发安全的程序了。
  • 另一部分是针对JVM实现的,为了尽可能少的对编译器和处理器做约束从而提高性能,JMM在不影响程序执行结果的前提下对其不做要求,即允许优化重排序。我们只需要关注前者就好了,也就是理解happens-before规则即可,其它繁杂的内容有JMM规范结合操作系统给我们搞定,我们只写好代码即可。

6. 面试题

  1. 你知道什么是Java内存模型JMM吗?
  2. JMM与volatile它们两个之间的关系?
  3. JMM有哪些特性or它的三大特性是什么?
  4. 为什么要有JMM,它为什么出现?作用和功能是什么?
  5. happens-before先行发生原则你有了解过吗?