深入理解Java内存模型

来源：互联网发布：中科院软件研究所待遇编辑：程序博客网时间：2024/06/11 18:47

深入理解java内存模型(一)

并发编程中，有两个关键问题要处理:线程之间如何通信和线程之间如何同步，(这里的线程指并发执行的活动实体)，通信是指线程之间以何种机制来交换信息。在命令式编程中，线程之间的通信机制有两种：共享内存和消息传递。

在共享内存的并发模型中，线程之间共享程序的公共状态，线程之间通过写和读内存中的公共状态来来隐式进行通信。

在消息传递的并发模型里，线程之间没有公共状态，所以必须通过明确的发送消息来显式进行通信。

同步是指程序用于控制不同线程之间操作发生相对顺序的机制。在共享内存并发模型中，同步是显式进行的。程序员必须显式指定某个方法或某段代码需要在线程之间互斥执行。在消息传递的并发模型里，由于消息的发送必须在消息的接受之前，因此同步是隐式进行的。

java的并发采用共享内存模型，因此通信是隐式进行的，整个过程对程序员完全透明。

java内存模型的抽象

在java中，所有实例域，静态域和数组元素存储在堆内存中，堆内存在线程之间共享（本文使用”共享变量”这个术语代指实例域，静态域和数组元素）。局部变量(local variables),方法定义参数，（formal method parameters)和异常处理器参数（exception handler)不会在线程之间共享，他们不会有内存可见性问题，也不受内存模型的影响。

Java线程之间的通信由java内存模型(JMM)控制，JMM决定一个线程对共享变量的写入何时对另一个线程可见。从抽象的角度来看，JMM定义了线程和主内存之间的抽象关系：线程之间的共享变量存储在主内存中，每个线程有一个私有的本地内存，本地内存中存储了该线程以读/写共享变量的副本。本地内存是JMM的一个抽象概念，并不真实存在。它涵盖了缓存，写缓冲区，寄存器以及其他的硬件和编译器优化。Java内存模型的抽象示意图如下

从上图来看，线程A与线程B之间如要通信的话，必须要经历下面两个步骤：

1.首先，线程A把本地内存A中更新过的共享变量刷新到主内存中。2.然后，线程B到主内存中去读线程A之前已更新过的共享变量

下面通过示意图来说明这两个步骤：

从整体来看，这两个步骤实质上是线程A在向线程B发送消息，而且这个通信过程必须要经过主内存。JMM通过控制主内存与每个线程的本地内存之间的交互，来为Java程序员提供内存可见性保证。

重排序

在执行程序时为了提供性能，编译器和处理器常常会对指令做重排序。重排序分三种类型：
1.编译器优化的重排序。编译器在不改变单线程语义的前提下，可以重新安排语句的执行顺序。
2.指令级并行的重排序。现代处理器采用了指令级并行技术，来将多条指令重叠执行。如果不存在数据依赖，处理器可以改变对应机器指令的执行顺序。
3.内存系统的重排序。由于处理器使用缓存和读/写缓冲区，这使得加载和存储操作看上去可能是在乱序执行。

从java源代码到最终实际执行的指令序列，会分别经历下面三种重排序：

1属于编译器重排序，2和3属于处理器重排序。这些重排序都可能会导致多线程程序出现内存可见性问题。对于编译器，JMM的编译器重排序规则会禁止特定类型的编译器重排序。对于处理器重排序，JMM的处理器重排序规则会要求Java编译器在生成指令序列时，插入特定的内存屏障指令，通过内存屏障指令来禁止特定类型的处理器重排序。

JMM属于语言级的内存模型，它确保在不同的编译器和不同的处理器平台上，通过禁止特定类型的编译器重排序和处理器重排序，微程序猿提供一致的内存可见性保证。

处理器重排序与内存屏障指令

现代的处理器使用写缓冲区来临时保存向内存写入的数据。写缓冲区可以保证指令流水线持续运行，它可以避免由于处理器停顿下来等待向内存写入数据而产生的延迟。同时，通过以批处理的方式刷新写缓冲区，以及合并写缓冲区中对同一内存地址的多次写，可以减少对内存总线的占用。虽然写缓冲区有这么多好处，但每个处理器上的写缓冲区，仅仅对它所在的处理器可见。这个特性会堆内存操作的执行顺序产生重要的影响：处理器对内存的读/写操作的执行顺序，不一定与内存实际发生的读/写操作顺序一致！为了具体说明，请看下面示例：

| Processor A | Processor B|| ------------|:----------:|| a = 1;//A1  | b = 2;//B1 || x = b;//A2  | y = a;//B2 |初始状态: a = b = 0处理器允许执行后得到结果： x = y = 0

假设处理器A和处理器B按程序的顺序并行执行内存访问，最终却可能得到x = y = 0的结果。具体的原因如下：

处理器A和B可以同时把共享变量写入自己的写缓冲区A1，B1，然后从内存中读取另一个共享变量(A2，B2)，最后才把自己写缓存区中保存中的脏数据刷新到内存中(A3,B3)。当以这种时序执行时，程序就可以得到x = y =0的结果。
从内存操作实际发生的顺序来看，直到处理器A执行A3来刷新自己的写缓存区，写操作A1才算真正执行了。虽然处理器A执行内存才做的顺序是：A1->A2，但内存操作实际发生的顺序却是:A2->A1。此时，处理器A的内存操作顺序被重排序了（处理器B的情况和处理器A一样，这里就不赘述了）。

这里的关键是，由于写缓冲区仅对自己的处理器可见，它会导致处理器执行内存操作的顺序可能会与内存实际的操作执行顺序不一致。由于现代的处理器都会使用写缓冲区，因此现代的处理器都会允许对写-读操作做重排序。

为了保证内存可见性，Java编译器在生成指令序列的适当位置会插入内存屏障指令来禁止特定类型的处理器重排序。JMM吧内存屏障指令分为下列四类：

-屏障类型                   指令示例            -说明-LoadLoadBarriers       Load1;          确保Load1数据的                        LoadLoad;       装载，之前于Load                        Load2           2及所有后续装载                                        指令的装载。-StoreStoreBarriers     Store1;         确保Store1数据                        StoreStore;     对其他处理器可见                        Store2;         之前于Store2及                                        所有后续存储指令                                        的存储。-LoadStoreBarriers      Load1;          确保Load1数据装                        LoadStore;      载，之前于Store                        Store2                                                  2及所有后续的存                                        储指令刷新到内存。-StoreLoadBarriers      Store1;         确保Store1数据-                       StoreLoad;      对其他处理器变得-                       Load2           可见，之前于LOAD            -                           2及所有后续装载            -                           指令的装载。Stor-                                       eLoad Barriers                                          -                                   会使该屏障之前的-                                       所有内存访问指令-                                       (存储和装载指令)-                                       完成之后，才执行-                                       该屏障之后的内存                                        -                                       访问指令。

StoreLoad Barriers是一个“全能型”的屏障，它同时具有其他三个屏障的效果。

happens-before

JSR-133提出了happens-before的概念，通过这个概念来阐述操作之间的内存可见性。如果一个操作执行的结果需要对另一个操作可见，那么这两个操作之间必须存在happens-before关系。这里提到的两个操作既可以是在一个线程之内，也可以是在不同线程之间。与程序员密切相关的happens-before规则如下：

程序顺序规则:一个线程中的每个操作，happens-before于该线程中的任意后续操作
监视器锁规则：对一个监视器锁的解锁，happens-before于随后对这个监视器锁的加锁。
volatile变量规则：对一个volatile域的写，happens-before与任意后续对这个volatile域的读。
传递性：如果A happens-before B,且B happens-before C,那么 A happens-before C、

注意，两个操作之间具有happens-before关系，并不意味着前一个操作必须要在后一个操作之前执行!happens-before仅仅要求前一个操作的执行结果对后一个操作可见，且前一个操作按顺序排在第二个操作之前

转自 HollisChuang’s Blog：

0 0