Java 延迟写入：Unsafe.put/getOrdered、put/getVolatile 与 volatile

volatile

为了后续理解，先简单说下 volatile 关键字。

volatile 修饰变量提供内存可见性，JSR-133 增强了 volatile 的内存语义（happens-before）：限制编译器和处理器对 volatile 变量与普通变量的重排序。

JVM 提供的禁止重排序支持，实现原理是内存屏障：读屏障（Load Barrier）和写屏障（Store Barrier）。

内存屏障作用：

阻止屏障两侧的指令重排序。
强制把写缓冲区 / 高速缓存中的脏数据等写回主内存，或者让缓存中相应的数据失效。

Java 对内存屏障的使用策略：编译器在为 volatile 变量读写生成字节码时，在指令序列中插入内存屏障来禁止处理器重排序，以实现 JSR-133 增强部分的 volatile 内存语义。

在每个 volatile 写操作前插入一个 StoreStore 屏障；
在每个 volatile 写操作后插入一个 StoreLoad 屏障；
在每个 volatile 读操作后插入一个 LoadLoad 屏障；
在每个 volatile 读操作后再插入一个 LoadStore 屏障。

伪代码：

StoreStore `volatile变量——写` StoreLoad; // 写前指令都不能重排序，写后volatile读不能重排序
`volatile变量——读` LoadLoad + LoadStore; // 读后指令都不能重排序

内存屏障

x86 上内存屏障的实现：

static inline void compiler_barrier() {
  // 内嵌汇编，格式：__asm__ (汇编语句模板: 输出部分: 输入部分: 破坏描述部分)
  __asm__ volatile ("" : : : "memory");     // 编译屏障
  // volatile ：告诉GCC编译器，禁止重排序
  // ("" : : : "memory")：告诉GCC编译器，禁止"memory"前后代码重排序、缓存作废，需要时再内存读
}

inline void OrderAccess::loadload()   { compiler_barrier(); }
inline void OrderAccess::storestore() { compiler_barrier(); }
inline void OrderAccess::loadstore()  { compiler_barrier(); }
inline void OrderAccess::storeload()  { fence();            }

inline void OrderAccess::acquire()    { compiler_barrier(); }
inline void OrderAccess::release()    { compiler_barrier(); }

inline void OrderAccess::fence() {
   // always use locked addl since mfence is sometimes expensive 内存屏障消耗的资源大于locked指令
#ifdef AMD64  
  __asm__ volatile ("lock; addl $0,0(%%rsp)" : : : "cc", "memory");
#else
  // StoreLoad 屏障
  // 对指定寄存器+0，空操作，为了使用lock而使用
  // x84平台，基于MESI，致使该缓存行中数据在其他CPU中失效
  __asm__ volatile ("lock; addl $0,0(%%esp)" : : : "cc", "memory");
#endif
  compiler_barrier();
}