1.JMM介绍
JMM是指JAVA内存模型,JVM是java虚拟机的意思,两者是截然不同的两个东西,他们两个之间的关系类似于雷锋和雷锋塔的关系
JMM(Java内存模型Java Memory Model,简称JMM)本身是一种抽象的概念并不真实存在它仅仅描述的是一组约定或规范,通过这组规范定义了程序中(尤其是多线程)各个变量的读写访问方式并决定一个线程对共享变量的写入何时以及如何变成对另一个线程可见。
原则:JMM的关键技术点都是围绕多线程的原子性、可见性和有序性展开的
JMM能干嘛?
1、通过JMM来实现线程和主内存之间的抽象关系。
2、屏蔽各个硬件平台和操作系统的内存访问差异以实现让Java程序在各种平台下都能达到一致的内存访问效果。
补充:硬件内存架构的一些问题:(多线程环境下尤其)
缓存一致性问题:在多处理器系统中,每个处理器都有自己的高速缓存,而它们又共享同一主内存(MainMemory)。基于高速缓存的存储交互很好地解决了处理器与内存的速度矛盾,但是也引入了新的问题:缓存一致性(CacheCoherence)。当多个处理器的运算任务都涉及同一块主内存区域时,将可能导致各自的缓存数据不一致的情况,如果真的发生这种情况,那同步回到主内存时以谁的缓存数据为准呢?为了解决一致性的问题,需要各个处理器访问缓存时都遵循一些协议,在读写时要根据协议来进行操作,这类协议有MSI、MESI(IllinoisProtocol)、MOSI、Synapse、Firefly及DragonProtocol,等等:
指令重排序问题:为了使得处理器内部的运算单元能尽量被充分利用,处理器可能会对输入代码进行乱序执行(Out-Of-Order Execution)优化,处理器会在计算之后将乱序执行的结果重组,保证该结果与顺序执行的结果是一致的,但并不保证程序中各个语句计算的先后顺序与输入代码中的顺序一致。因此,如果存在一个计算任务依赖另一个计算任务的中间结果,那么其顺序性并不能靠代码的先后顺序来保证。与处理器的乱序执行优化类似,Java虚拟机的即时编译器中也有类似的指令重排序(Instruction Reorder)优化
2.JMM三大特性
2.1.原子性
指一个操作是不可中断的,即多线程环境下,操作不能被其他线程干扰
改的时候只有一个线程来改
2.2.可见性
是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更 ,JMM规定了所有的变量都存储在主内存中。
Java中普通的共享变量工作内存,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取,赋值等 )都必需在线程自己的工作内存中进行,而不能够直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成
如果没有保证可见性会有什么问题:
答:导致-线程脏读,举例如下
1、主内存中有变量 x,初始值为 0
2、线程 A 要将 x 加 1,先将 x=0 拷贝到自己的私有内存中,然后更新 x 的值
3、线程 A 将更新后的 x 值回刷到主内存的时间是不固定的
4、刚好在线程 A 没有回刷 x 到主内存时,线程 B 同样从主内存中读取 x,此时为 0,和线程 A 一样的操作,最后期盼的 x=2 就会变成 x=1
为了解决这种问题,我们就要保障改的时候只有一个线程来改,不要错乱,要保证原子。改完以后要立即通知别人
可见性是一种及时可见,及时通知机制
volatile可以解决可见性(能否及时看到)
2.3.有序性
有序性是什么?
对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。但为了提高性能,编译器和处理器通常会对指令序列进行重新排序。Java规范规定JVM线程内部维持顺序化语义,即只要程序的最终结果与它顺序化执行的结果相等,那么指令的执行顺序可以与代码顺序不一致,此过程叫指令的重排序。
优缺点
JVM能根据处理器特性(CPU多级缓存系统、多核处理器等)适当的机器对指令进行重排序,使得机器指令能更符合CPU的执行特性,最大限度的发挥机器性能。但是,指令重排可以保证串行语义一致,但没有义务保证多线程间的语义也一致(即可能产生“脏读”),简单说,两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序会被优化。
指令重排的三种表现(层面)
- 编译器优化的重排
- 指令并行的重排
- 内存系统的重排
总结
单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。 处理器在进行重排序时必须要考虑指令之间的数据依赖性
多线程无法确定的,结果无法预测
3.
但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到的线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存中存储着主内存中的变量副本拷贝,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成,其简要访问过程如上图
JMM定义了线程和主内存之间的抽象关系:
1、线程之间的共享变量存储在主内存中(从硬件角度来说就是内存条)
2、每个线程都有一个私有的本地工作内存,本地工作内存中存储了该线程用来读/写共享变量的副本(从硬件角度来说就是CPU的缓存,比如寄存器、L1、L2、L3缓存等)
总结:
- 我们定义的所有共享变量都存储在物理主内存中
- 每个线程都有自己独立的工作内存,里面保存该线程使用到的变量的副本(主内存中该变量的一份拷贝)
- 线程对共享变量所有的操作都必须先在线程自己的工作内存中进行后写回主内存,不能直接从主内存中读写(不能越级)
- 不同线程之间也无法直接访问其他线程的工作内存中的变量,线程间变量值的传递需要通过主内存来进行(同级不能相互访问)
4.JMM之happens-before
为什么我们写的这些程序好像只需要简单加个锁,就可以控制线程,其实底层结合我们的JMM规范结合happens-befors 在语言级别,编译器系统级别做了很多规定,我们有必要了解底层原理
happens-before先行发生原则:在JMM中,如果一个操作执行的结果需要对另一个操作可见性或者代码重新排序,那么这两个操作之间必须存在happens-before(先行发生)原则。逻辑上的先后关系。(白话就是决定多线程之间要配合谁先谁后以后,互相让其他线程获得感知)
先行发生原则(happens-before
)被定义在了JMM之中:
如果Java内存模型中所有的有序性都仅靠volatile和synchronized来完成,那么有很多操作都将会变得非常啰嗦,但是我们在编写Java并发代码的时候并没有察觉到这一点。
我们没有时时、处处、次次,添加volatile和synchronized来完成程序,这是因为Java语言中JMM原则下,有一个“先行发生”(Happens-Before)的原则限制和规矩
这个原则非常重要:
x,y案例说明:
x=5;线程A执行
y=x;线程B执行
问:y一定等于5吗?
答:不一定
如果线程A的操作(x= 5)happens-before(先行发生)线程B的操作(y = x),那么可以确定线程B执行后y = 5 一定成立;
如果他们不存在happens-before原则,那么y = 5 不一定成立。
是happens-before原则的威力。——————-》包含可见性和有序性的约束
4.1.happens-before总原则
- 如果一个操作
happens-before
另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前。(可见性,有序性) - 两个操作之间存在happens-before关系,并不一定要按照
happens-before
原则制定的顺序来执行。如果重排序之后的执行结果与按照happens-before关系来执行的结果一致,那么这种重排序并不非法。(可以指令重排)
4.2.happens-before8条
JMM天然存在的
happens-before
关系,8条
1、次序规则:一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作。
讲白话就是前面一个操作把变量X赋值为1,那后面一个操作肯定能知道X已经变成了1
2、锁定规则:锁的获取的先后顺序
一个unLock
操作先行发生于后面(这里的后面是指时间上的先后)对同一个锁的lock
操作(一个线程想要lock,肯定要等前面的锁unLock
释放这个资源)
3、volatile变量规则:
对一个volatile变量的读写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的,这里的后面同样是指时间上的先后。
4、传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C
5、线程启动规则(Thread Start Rule):
Thread对象的start()
Thread t1 = new Thread(()->{ System.out.println("----hello thread")//后执行 },"t1"); t1.start();//-------------------先执行
方法先行发生于此线程的每一个动作
6、线程中断规则(Thread Interruption Rule)
对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生;可以通过Thread.interrupted()检测到是否发生中断。
也就是说你要先调用了interrupt()
方法设置过中断标志位,我才能检测到中断发送。
7、线程终止规则(Thread Termination Rule)
线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过isAlive()
等手段检测线程是否已经终止执行。
8、对象终止规则(Finalizer Rule)
一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始
清理操作。
4.3.案例说明
代码展示
public class TestDemo { private int value = 0; public int getValue(){ return value; } public int setValue(){ return ++value; } }
问:假设存在线程A和B,线程A先(时间上的先后)调用了setValue(),然后线程B调用了同一个对象的getValue(),那么线程B收到的返回值是什么?是0还是1?
答:真不一定
我们就这段简单的代码一次分析happens-before的规则(规则5、6、7、8 可以忽略,因为他们和这段代码毫无关系): 1、由于两个方法是由不同的线程调用,不在同一个线程中,所以肯定不满足程序次序规则; 2、两个方法都没有使用锁,所以不满足锁定规则; 3、变量不是用volatile修饰的,所以volatile变量规则不满足; 4、传递规则肯定不满足;
所以我们无法通过happens-before原则推导出线程A happens-before线程B,虽然可以确认在时间上线程A优先于线程B指定,
解决方案一:使用synchronized锁,通过锁定规则满足happens-before
public class TestDemo { private int value = 0; public synchronized int getValue(){ return value; } public synchronized int setValue(){ return ++value; } }
缺点:synchronized太猛了,降低太多的效率
并发小用上面的案例,并发大用下面的案例
解决方案二:
把value定义为volatile变量,由于setter方法对value的修改不依赖value的值,满足volatile关键字使用场景 理由:利用volatile保证读取操作的可见性
public class TestDemo { private volatile int value = 0; public int getValue(){ return value; // 利用volatile保证读取操作的可见性 } public int setValue(){ return ++value; // 利用synchronized保证复合操作的原子性 } }