Java內(nèi)存模型以及happens-before規(guī)則

本人免費整理了Java高級資料，涵蓋了Java、redis、MongoDB、MySQL、Zookeeper、Spring Cloud、Dubbo高并發(fā)分布式等教程，一共30G，需要自己領(lǐng)取。
傳送門：https://mp.weixin.qq.com/s/JzddfH-7yNudmkjT0IRL8Q

1. JMM的介紹

在上一篇文章中總結(jié)了雖然這種回答似乎不能獲取什么內(nèi)容，可以google下。在<<深入理解Java虛擬機>>中看到的定義。原文如下：當多個線程訪問同一個對象時，如果不用考慮這些線程在運行時環(huán)境下的調(diào)度和交替運行，也不需要進行額外的同步，或者在調(diào)用方進行任何其他的協(xié)調(diào)操作，調(diào)用這個對象的行為都可以獲取正確的結(jié)果，那這個對象是線程安全的。

創(chuàng)新互聯(lián)公司是一家專注網(wǎng)站建設(shè)、網(wǎng)絡(luò)營銷策劃、小程序定制開發(fā)、電子商務(wù)建設(shè)、網(wǎng)絡(luò)推廣、移動互聯(lián)開發(fā)、研究、服務(wù)為一體的技術(shù)型公司。公司成立十載以來，已經(jīng)為上千家混凝土泵車各業(yè)的企業(yè)公司提供互聯(lián)網(wǎng)服務(wù)?，F(xiàn)在，服務(wù)的上千家客戶與我們一路同行，見證我們的成長；未來，我們一起分享成功的喜悅。

關(guān)于定義的理解這是一個仁者見仁智者見智的事情。出現(xiàn)線程安全的問題一般是因為主內(nèi)存和工作內(nèi)存數(shù)據(jù)不一致性和重排序?qū)е碌?，而解決線程安全的問題最重要的就是理解這兩種問題是怎么來的，那么，理解它們的核心在于理解java內(nèi)存模型（JMM）。

在多線程條件下，多個線程肯定會相互協(xié)作完成一件事情，一般來說就會涉及到多個線程間相互通信告知彼此的狀態(tài)以及當前的執(zhí)行結(jié)果等，另外，為了性能優(yōu)化，還會涉及到編譯器指令重排序和處理器指令重排序。下面會一一來聊聊這些知識。

2. 內(nèi)存模型抽象結(jié)構(gòu)

線程間協(xié)作通信可以類比人與人之間的協(xié)作的方式，在現(xiàn)實生活中，之前網(wǎng)上有個流行語“你媽喊你回家吃飯了”，就以這個生活場景為例，小.明在外面玩耍，小.明媽媽在家里做飯，做晚飯后準備叫小.明回家吃飯，那么就存在兩種方式：

小.明媽媽要去上班了十分緊急這個時候手機又沒有電了，于是就在桌子上貼了一張紙條“飯做好了，放在...”小.明回家后看到紙條如愿吃到媽媽做的飯菜，那么，如果將小.明媽媽和小.明作為兩個線程，那么這張紙條就是這兩個線程間通信的共享變量，通過讀寫共享變量實現(xiàn)兩個線程間協(xié)作；

還有一種方式就是，媽.媽.的手機還有電，媽媽在趕去坐公交的路上給小.明打了個電話，這種方式就是通知機制來完成協(xié)作。同樣，可以引申到線程間通信機制。

通過上面這個例子，應(yīng)該有些認識。在并發(fā)編程中主要需要解決兩個問題：1. 線程之間如何通信；2.線程之間如何完成同步（這里的線程指的是并發(fā)執(zhí)行的活動實體）。通信是指線程之間以何種機制來交換信息，主要有兩種：共享內(nèi)存和消息傳遞。這里，可以分別類比上面的兩個舉例。

java內(nèi)存模型是共享內(nèi)存的并發(fā)模型，線程之間主要通過讀-寫共享變量來完成隱式通信。如果程序員不能理解Java的共享內(nèi)存模型在編寫并發(fā)程序時一定會遇到各種各樣關(guān)于內(nèi)存可見性的問題。

1.哪些是共享變量

在java程序中所有實例域，靜態(tài)域和數(shù)組元素都是放在堆內(nèi)存中（所有線程均可訪問到，是可以共享的），而局部變量，方法定義參數(shù)和異常處理器參數(shù)不會在線程間共享。共享數(shù)據(jù)會出現(xiàn)線程安全的問題，而非共享數(shù)據(jù)不會出現(xiàn)線程安全的問題。關(guān)于JVM運行時內(nèi)存區(qū)域在后面的文章會講到。

2.JMM抽象結(jié)構(gòu)模型

我們知道CPU的處理速度和主存的讀寫速度不是一個量級的，為了平衡這種巨大的差距，每個CPU都會有緩存。因此，共享變量會先放在主存中，每個線程都有屬于自己的工作內(nèi)存，并且會把位于主存中的共享變量拷貝到自己的工作內(nèi)存，之后的讀寫操作均使用位于工作內(nèi)存的變量副本，并在某個時刻將工作內(nèi)存的變量副本寫回到主存中去。JMM就從抽象層次定義了這種方式，并且JMM決定了一個線程對共享變量的寫入何時對其他線程是可見的。

Java內(nèi)存模型以及happens-before規(guī)則

如圖為JMM抽象示意圖，線程A和線程B之間要完成通信的話，要經(jīng)歷如下兩步：

線程A從主內(nèi)存中將共享變量讀入線程A的工作內(nèi)存后并進行操作，之后將數(shù)據(jù)重新寫回到主內(nèi)存中；
線程B從主存中讀取最新的共享變量

從橫向去看看，線程A和線程B就好像通過共享變量在進行隱式通信。這其中有很有意思的問題，如果線程A更新后數(shù)據(jù)并沒有及時寫回到主存，而此時線程B讀到的是過期的數(shù)據(jù)，這就出現(xiàn)了“臟讀”現(xiàn)象?？梢酝ㄟ^同步機制（控制不同線程間操作發(fā)生的相對順序）來解決或者通過volatile關(guān)鍵字使得每次volatile變量都能夠強制刷新到主存，從而對每個線程都是可見的。

3. 重排序

一個好的內(nèi)存模型實際上會放松對處理器和編譯器規(guī)則的束縛，也就是說軟件技術(shù)和硬件技術(shù)都為同一個目標而進行奮斗：在不改變程序執(zhí)行結(jié)果的前提下，盡可能提高并行度。JMM對底層盡量減少約束，使其能夠發(fā)揮自身優(yōu)勢。因此，在執(zhí)行程序時，為了提高性能，編譯器和處理器常常會對指令進行重排序。一般重排序可以分為如下三種：

Java內(nèi)存模型以及happens-before規(guī)則

編譯器優(yōu)化的重排序。編譯器在不改變單線程程序語義的前提下，可以重新安排語句的執(zhí)行順序；
指令級并行的重排序?，F(xiàn)代處理器采用了指令級并行技術(shù)來將多條指令重疊執(zhí)行。如果不存在數(shù)據(jù)依賴性，處理器可以改變語句對應(yīng)機器指令的執(zhí)行順序；
內(nèi)存系統(tǒng)的重排序。由于處理器使用緩存和讀/寫緩沖區(qū)，這使得加載和存儲操作看上去可能是在亂序執(zhí)行的。

如圖，1屬于編譯器重排序，而2和3統(tǒng)稱為處理器重排序。這些重排序會導(dǎo)致線程安全的問題，一個很經(jīng)典的例子就是DCL問題，這個在以后的文章中會具體去聊。針對編譯器重排序，JMM的編譯器重排序規(guī)則會禁止一些特定類型的編譯器重排序；針對處理器重排序，編譯器在生成指令序列的時候會通過插入內(nèi)存屏障指令來禁止某些特殊的處理器重排序。
那么什么情況下，不能進行重排序了？下面就來說說數(shù)據(jù)依賴性。

有如下代碼：

??double?pi?=?3.14?//A
?double?r?=?1.0???//B
?double?area?=?pi?*?r?*?r?//C

這是一個計算圓面積的代碼，由于A,B之間沒有任何關(guān)系，對最終結(jié)果也不會存在關(guān)系，它們之間執(zhí)行順序可以重排序。因此可以執(zhí)行順序可以是A->B->C或者B->A->C執(zhí)行最終結(jié)果都是3.14，即A和B之間沒有數(shù)據(jù)依賴性。

具體的定義為：如果兩個操作訪問同一個變量，且這兩個操作有一個為寫操作，此時這兩個操作就存在數(shù)據(jù)依賴性這里就存在三種情況：1. 讀后寫；2.寫后寫；3. 寫后讀，者三種操作都是存在數(shù)據(jù)依賴性的，如果重排序會對最終執(zhí)行結(jié)果會存在影響。

編譯器和處理器在重排序時，會遵守數(shù)據(jù)依賴性，編譯器和處理器不會改變存在數(shù)據(jù)依賴性關(guān)系的兩個操作的執(zhí)行順序

另外，還有一個比較有意思的就是as-if-serial語義。

as-if-serial

as-if-serial語義的意思是：不管怎么重排序（編譯器和處理器為了提供并行度），（單線程）程序的執(zhí)行結(jié)果不能被改變。編譯器，runtime和處理器都必須遵守as-if-serial語義。as-if-serial語義把單線程程序保護了起來，遵守as-if-serial語義的編譯器，runtime和處理器共同為編寫單線程程序的程序員創(chuàng)建了一個幻覺：單線程程序是按程序的順序來執(zhí)行的。

比如上面計算圓面積的代碼，在單線程中，會讓人感覺代碼是一行一行順序執(zhí)行上，實際上A,B兩行不存在數(shù)據(jù)依賴性可能會進行重排序，即A，B不是順序執(zhí)行的。as-if-serial語義使程序員不必擔心單線程中重排序的問題干擾他們，也無需擔心內(nèi)存可見性問題。

4. happens-before規(guī)則

上面的內(nèi)容講述了重排序原則，一會是編譯器重排序一會是處理器重排序，如果讓程序員再去了解這些底層的實現(xiàn)以及具體規(guī)則，那么程序員的負擔就太重了，嚴重影響了并發(fā)編程的效率。因此，JMM為程序員在上層提供了六條規(guī)則，這樣我們就可以根據(jù)規(guī)則去推論跨線程的內(nèi)存可見性問題，而不用再去理解底層重排序的規(guī)則。下面以兩個方面來說。

4.1 happens-before定義
happens-before的概念最初由Leslie Lamport在其一篇影響深遠的論文（《Time，Clocks and the Ordering of Events in a Distributed System》）中提出，有興趣的可以google一下。JSR-133使用happens-before的概念來指定兩個操作之間的執(zhí)行順序。由于這兩個操作可以在一個線程之內(nèi)，也可以是在不同線程之間。

因此，JMM可以通過happens-before關(guān)系向程序員提供跨線程的內(nèi)存可見性保證（如果A線程的寫操作a與B線程的讀操作b之間存在happens-before關(guān)系，盡管a操作和b操作在不同的線程中執(zhí)行，但JMM向程序員保證a操作將對b操作可見）。

具體的定義為：
1）如果一個操作happens-before另一個操作，那么第一個操作的執(zhí)行結(jié)果將對第二個操作可見，而且第一個操作的執(zhí)行順序排在第二個操作之前。

2）兩個操作之間存在happens-before關(guān)系，并不意味著Java平臺的具體實現(xiàn)必須要按照happens-before關(guān)系指定的順序來執(zhí)行。如果重排序之后的執(zhí)行結(jié)果，與按happens-before關(guān)系來執(zhí)行的結(jié)果一致，那么這種重排序并不非法（也就是說，JMM允許這種重排序）。

上面的1）是JMM對程序員的承諾。從程序員的角度來說，可以這樣理解happens-before關(guān)系：如果A happens-before B，那么Java內(nèi)存模型將向程序員保證——A操作的結(jié)果將對B可見，且A的執(zhí)行順序排在B之前。注意，這只是Java內(nèi)存模型向程序員做出的保證！

上面的2）是JMM對編譯器和處理器重排序的約束原則。正如前面所言，JMM其實是在遵循一個基本原則：只要不改變程序的執(zhí)行結(jié)果（指的是單線程程序和正確同步的多線程程序），編譯器和處理器怎么優(yōu)化都行。

JMM這么做的原因是：程序員對于這兩個操作是否真的被重排序并不關(guān)心，程序員關(guān)心的是程序執(zhí)行時的語義不能被改變（即執(zhí)行結(jié)果不能被改變）。因此，happens-before關(guān)系本質(zhì)上和as-if-serial語義是一回事。

下面來比較一下as-if-serial和happens-before:

as-if-serial VS happens-before

as-if-serial語義保證單線程內(nèi)程序的執(zhí)行結(jié)果不被改變，happens-before關(guān)系保證正確同步的多線程程序的執(zhí)行結(jié)果不被改變。
as-if-serial語義給編寫單線程程序的程序員創(chuàng)造了一個幻境：單線程程序是按程序的順序來執(zhí)行的。happens-before關(guān)系給編寫正確同步的多線程程序的程序員創(chuàng)造了一個幻境：正確同步的多線程程序是按happens-before指定的順序來執(zhí)行的。
as-if-serial語義和happens-before這么做的目的，都是為了在不改變程序執(zhí)行結(jié)果的前提下，盡可能地提高程序執(zhí)行的并行度。

4.2 具體規(guī)則
具體的一共有六項規(guī)則：

程序順序規(guī)則：一個線程中的每個操作，happens-before于該線程中的任意后續(xù)操作。
監(jiān)視器鎖規(guī)則：對一個鎖的解鎖，happens-before于隨后對這個鎖的加鎖。
volatile變量規(guī)則：對一個volatile域的寫，happens-before于任意后續(xù)對這個volatile域的讀。
傳遞性：如果A happens-before B，且B happens-before C，那么A happens-before C。
start()規(guī)則：如果線程A執(zhí)行操作ThreadB.start()（啟動線程B），那么A線程的ThreadB.start()操作happens-before于線程B中的任意操作。
join()規(guī)則：如果線程A執(zhí)行操作ThreadB.join()并成功返回，那么線程B中的任意操作happens-before于線程A從ThreadB.join()操作成功返回。
程序中斷規(guī)則：對線程interrupted()方法的調(diào)用先行于被中斷線程的代碼檢測到中斷時間的發(fā)生。
對象finalize規(guī)則：一個對象的初始化完成（構(gòu)造函數(shù)執(zhí)行結(jié)束）先行于發(fā)生它的finalize()方法的開始。

下面以一個具體的例子來講下如何使用這些規(guī)則進行推論：

依舊以上面計算圓面積的進行描述。利用程序順序規(guī)則（規(guī)則1）存在三個happens-before關(guān)系：
1. A happens-before B；
2. B happens-before C;
3. A happens-before C。
這里的第三個關(guān)系是利用傳遞性進行推論的。
A happens-before B,定義1要求A執(zhí)行結(jié)果對B可見，并且A操作的執(zhí)行順序在B操作之前，但與此同時利用定義中的第二條，A,B操作彼此不存在數(shù)據(jù)依賴性，兩個操作的執(zhí)行順序?qū)ψ罱K結(jié)果都不會產(chǎn)生影響，在不改變最終結(jié)果的前提下，允許A，B兩個操作重排序，即happens-before關(guān)系并不代表了最終的執(zhí)行順序。

5. 總結(jié)
上面已經(jīng)聊了關(guān)于JMM的兩個方面：
1. JMM的抽象結(jié)構(gòu)（主內(nèi)存和線程工作內(nèi)存）；
2. 重排序以及happens-before規(guī)則。

接下來，我們來做一個總結(jié)。從兩個方面進行考慮。
1. 如果讓我們設(shè)計JMM應(yīng)該從哪些方面考慮，也就是說JMM承擔哪些功能；
2. happens-before與JMM的關(guān)系；
3. 由于JMM，多線程情況下可能會出現(xiàn)哪些問題？
5.1 JMM的設(shè)計

Java內(nèi)存模型以及happens-before規(guī)則

JMM是語言級的內(nèi)存模型，在我的理解中JMM處于中間層，包含了兩個方面：
（1）內(nèi)存模型；
（2）重排序以及happens-before規(guī)則。
同時，為了禁止特定類型的重排序會對編譯器和處理器指令序列加以控制。
而上層會有基于JMM的關(guān)鍵字和J.U.C包下的一些具體類用來方便程序員能夠迅速高效率的進行并發(fā)編程。站在JMM設(shè)計者的角度，在設(shè)計JMM時需要考慮兩個關(guān)鍵因素:

程序員對內(nèi)存模型的使用?程序員希望內(nèi)存模型易于理解、易于編程。程序員希望基于一個強內(nèi)存模型來編寫代碼。
編譯器和處理器對內(nèi)存模型的實現(xiàn)?編譯器和處理器希望內(nèi)存模型對它們的束縛越少越好，這樣它們就可以做盡可能多的優(yōu)化來提高性能。編譯器和處理器希望實現(xiàn)一個弱內(nèi)存模型。

另外還要一個特別有意思的事情就是關(guān)于重排序問題，更簡單的說，重排序可以分為兩類：

會改變程序執(zhí)行結(jié)果的重排序。
不會改變程序執(zhí)行結(jié)果的重排序。

JMM對這兩種不同性質(zhì)的重排序，采取了不同的策略，如下。

對于會改變程序執(zhí)行結(jié)果的重排序，JMM要求編譯器和處理器必須禁止這種重排序。
對于不會改變程序執(zhí)行結(jié)果的重排序，JMM對編譯器和處理器不做要求（JMM允許這種重排序）

JMM的設(shè)計圖為：

Java內(nèi)存模型以及happens-before規(guī)則

從圖可以看出：

JMM向程序員提供的happens-before規(guī)則能滿足程序員的需求。JMM的happens-before規(guī)則不但簡單易懂，而且也向程序員提供了足夠強的內(nèi)存可見性保證（有些內(nèi)存可見性保證其實并不一定真實存在，比如上面的A happens-before B）。
JMM對編譯器和處理器的束縛已經(jīng)盡可能少。從上面的分析可以看出，JMM其實是在遵循一個基本原則：只要不改變程序的執(zhí)行結(jié)果（指的是單線程程序和正確同步的多線程程序），編譯器和處理器怎么優(yōu)化都行。例如，如果編譯器經(jīng)過細致的分析后，認定一個鎖只會被單個線程訪問，那么這個鎖可以被消除。再如，如果編譯器經(jīng)過細致的分析后，認定一個volatile變量只會被單個線程訪問，那么編譯器可以把這個volatile變量當作一個普通變量來對待。這些優(yōu)化既不會改變程序的執(zhí)行結(jié)果，又能提高程序的執(zhí)行效率。

5.2 happens-before與JMM的關(guān)系

Java內(nèi)存模型以及happens-before規(guī)則

一個happens-before規(guī)則對應(yīng)于一個或多個編譯器和處理器重排序規(guī)則。對于Java程序員來說，happens-before規(guī)則簡單易懂，它避免Java程序員為了理解JMM提供的內(nèi)存可見性保證而去學(xué)習(xí)復(fù)雜的重排序規(guī)則以及這些規(guī)則的具體實現(xiàn)方法

5.3 今后可能需要關(guān)注的問題
從上面內(nèi)存抽象結(jié)構(gòu)來說，可能出在數(shù)據(jù)“臟讀”的現(xiàn)象，這就是數(shù)據(jù)可見性的問題，另外，重排序在多線程中不注意的話也容易存在一些問題，比如一個很經(jīng)典的問題就是DCL（雙重檢驗鎖），這就是需要禁止重排序，另外，在多線程下原子操作例如i++不加以注意的也容易出現(xiàn)線程安全的問題。但總的來說，在多線程開發(fā)時需要從原子性，有序性，可見性三個方面進行考慮。J.U.C包下的并發(fā)工具類和并發(fā)容器也是需要花時間去掌握的，這些東西在以后得文章中多會一一進行討論。

名稱欄目：Java內(nèi)存模型以及happens-before規(guī)則
本文地址：http://muchs.cn/article8/ghidop.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供響應(yīng)式網(wǎng)站、關(guān)鍵詞優(yōu)化、標簽優(yōu)化、網(wǎng)站收錄、電子商務(wù)、靜態(tài)網(wǎng)站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

Java內(nèi)存模型以及happens-before規(guī)則

本人免費整理了Java高級資料，涵蓋了Java、redis、MongoDB、MySQL、Zookeeper、Spring Cloud、Dubbo高并發(fā)分布式等教程，一共30G，需要自己領(lǐng)取。傳送門：https://mp.weixin.qq.com/s/JzddfH-7yNudmkjT0IRL8Q

1. JMM的介紹

2. 內(nèi)存模型抽象結(jié)構(gòu)

3. 重排序

本人免費整理了Java高級資料，涵蓋了Java、redis、MongoDB、MySQL、Zookeeper、Spring Cloud、Dubbo高并發(fā)分布式等教程，一共30G，需要自己領(lǐng)取。
傳送門：https://mp.weixin.qq.com/s/JzddfH-7yNudmkjT0IRL8Q