go語言cpu計算 go使用gpu運算

【golang詳解】go語言GMP(GPM)原理和調(diào)度

Goroutine調(diào)度是一個很復(fù)雜的機制，下面嘗試用簡單的語言描述一下Goroutine調(diào)度機制，想要對其有更深入的了解可以去研讀一下源碼。

創(chuàng)新互聯(lián)建站-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比宜春網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式宜春網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們，業(yè)務(wù)覆蓋宜春地區(qū)。費用合理售后完善，10多年實體公司更值得信賴。

首先介紹一下GMP什么意思：

G ----------- goroutine: 即Go協(xié)程，每個go關(guān)鍵字都會創(chuàng)建一個協(xié)程。

M ---------- thread內(nèi)核級線程，所有的G都要放在M上才能運行。

P ----------- processor處理器，調(diào)度G到M上，其維護了一個隊列，存儲了所有需要它來調(diào)度的G。

Goroutine 調(diào)度器P和 OS 調(diào)度器是通過 M 結(jié)合起來的，每個 M 都代表了 1 個內(nèi)核線程，OS 調(diào)度器負責(zé)把內(nèi)核線程分配到 CPU 的核上執(zhí)行

模型圖：

避免頻繁的創(chuàng)建、銷毀線程，而是對線程的復(fù)用。

1）work stealing機制

當(dāng)本線程無可運行的G時，嘗試從其他線程綁定的P偷取G，而不是銷毀線程。

2）hand off機制

當(dāng)本線程M0因為G0進行系統(tǒng)調(diào)用阻塞時，線程釋放綁定的P，把P轉(zhuǎn)移給其他空閑的線程執(zhí)行。進而某個空閑的M1獲取P，繼續(xù)執(zhí)行P隊列中剩下的G。而M0由于陷入系統(tǒng)調(diào)用而進被阻塞，M1接替M0的工作，只要P不空閑，就可以保證充分利用CPU。M1的來源有可能是M的緩存池，也可能是新建的。當(dāng)G0系統(tǒng)調(diào)用結(jié)束后，根據(jù)M0是否能獲取到P，將會將G0做不同的處理：

如果有空閑的P，則獲取一個P，繼續(xù)執(zhí)行G0。

如果沒有空閑的P，則將G0放入全局隊列，等待被其他的P調(diào)度。然后M0將進入緩存池睡眠。

如下圖

GOMAXPROCS設(shè)置P的數(shù)量，最多有GOMAXPROCS個線程分布在多個CPU上同時運行

在Go中一個goroutine最多占用CPU 10ms，防止其他goroutine被餓死。

具體可以去看另一篇文章

【Golang詳解】go語言調(diào)度機制搶占式調(diào)度

當(dāng)創(chuàng)建一個新的G之后優(yōu)先加入本地隊列，如果本地隊列滿了，會將本地隊列的G移動到全局隊列里面，當(dāng)M執(zhí)行work stealing從其他P偷不到G時，它可以從全局G隊列獲取G。

協(xié)程經(jīng)歷過程

我們創(chuàng)建一個協(xié)程 go func()經(jīng)歷過程如下圖：

說明：

這里有兩個存儲G的隊列，一個是局部調(diào)度器P的本地隊列、一個是全局G隊列。新創(chuàng)建的G會先保存在P的本地隊列中，如果P的本地隊列已經(jīng)滿了就會保存在全局的隊列中；處理器本地隊列是一個使用數(shù)組構(gòu)成的環(huán)形鏈表，它最多可以存儲 256 個待執(zhí)行任務(wù)。

G只能運行在M中，一個M必須持有一個P，M與P是1：1的關(guān)系。M會從P的本地隊列彈出一個可執(zhí)行狀態(tài)的G來執(zhí)行，如果P的本地隊列為空，就會想其他的MP組合偷取一個可執(zhí)行的G來執(zhí)行；

一個M調(diào)度G執(zhí)行的過程是一個循環(huán)機制；會一直從本地隊列或全局隊列中獲取G

上面說到P的個數(shù)默認等于CPU核數(shù)，每個M必須持有一個P才可以執(zhí)行G，一般情況下M的個數(shù)會略大于P的個數(shù)，這多出來的M將會在G產(chǎn)生系統(tǒng)調(diào)用時發(fā)揮作用。類似線程池，Go也提供一個M的池子，需要時從池子中獲取，用完放回池子，不夠用時就再創(chuàng)建一個。

work-stealing調(diào)度算法：當(dāng)M執(zhí)行完了當(dāng)前P的本地隊列隊列里的所有G后，P也不會就這么在那躺尸啥都不干，它會先嘗試從全局隊列隊列尋找G來執(zhí)行，如果全局隊列為空，它會隨機挑選另外一個P，從它的隊列里中拿走一半的G到自己的隊列中執(zhí)行。

如果一切正常，調(diào)度器會以上述的那種方式順暢地運行，但這個世界沒這么美好，總有意外發(fā)生，以下分析goroutine在兩種例外情況下的行為。

Go runtime會在下面的goroutine被阻塞的情況下運行另外一個goroutine：

用戶態(tài)阻塞/喚醒

當(dāng)goroutine因為channel操作或者network I/O而阻塞時（實際上golang已經(jīng)用netpoller實現(xiàn)了goroutine網(wǎng)絡(luò)I/O阻塞不會導(dǎo)致M被阻塞，僅阻塞G，這里僅僅是舉個栗子），對應(yīng)的G會被放置到某個wait隊列(如channel的waitq)，該G的狀態(tài)由_Gruning變?yōu)開Gwaitting，而M會跳過該G嘗試獲取并執(zhí)行下一個G，如果此時沒有可運行的G供M運行，那么M將解綁P，并進入sleep狀態(tài)；當(dāng)阻塞的G被另一端的G2喚醒時（比如channel的可讀/寫通知），G被標(biāo)記為，嘗試加入G2所在P的runnext（runnext是線程下一個需要執(zhí)行的 Goroutine。），然后再是P的本地隊列和全局隊列。

系統(tǒng)調(diào)用阻塞

當(dāng)M執(zhí)行某一個G時候如果發(fā)生了阻塞操作，M會阻塞，如果當(dāng)前有一些G在執(zhí)行，調(diào)度器會把這個線程M從P中摘除，然后再創(chuàng)建一個新的操作系統(tǒng)的線程(如果有空閑的線程可用就復(fù)用空閑線程)來服務(wù)于這個P。當(dāng)M系統(tǒng)調(diào)用結(jié)束時候，這個G會嘗試獲取一個空閑的P執(zhí)行，并放入到這個P的本地隊列。如果獲取不到P，那么這個線程M變成休眠狀態(tài)，加入到空閑線程中，然后這個G會被放入全局隊列中。

隊列輪轉(zhuǎn)

可見每個P維護著一個包含G的隊列，不考慮G進入系統(tǒng)調(diào)用或IO操作的情況下，P周期性的將G調(diào)度到M中執(zhí)行，執(zhí)行一小段時間，將上下文保存下來，然后將G放到隊列尾部，然后從隊列中重新取出一個G進行調(diào)度。

除了每個P維護的G隊列以外，還有一個全局的隊列，每個P會周期性地查看全局隊列中是否有G待運行并將其調(diào)度到M中執(zhí)行，全局隊列中G的來源，主要有從系統(tǒng)調(diào)用中恢復(fù)的G。之所以P會周期性地查看全局隊列，也是為了防止全局隊列中的G被餓死。

M0是啟動程序后的編號為0的主線程，這個M對應(yīng)的實例會在全局變量rutime.m0中，不需要在heap上分配，M0負責(zé)執(zhí)行初始化操作和啟動第一個G，在之后M0就和其他的M一樣了

G0是每次啟動一個M都會第一個創(chuàng)建的goroutine，G0僅用于負責(zé)調(diào)度G，G0不指向任何可執(zhí)行的函數(shù)，每個M都會有一個自己的G0，在調(diào)度或系統(tǒng)調(diào)用時會使用G0的?？臻g，全局變量的G0是M0的G0

一個G由于調(diào)度被中斷，此后如何恢復(fù)？

中斷的時候?qū)⒓拇嫫骼锏臈Ｐ畔?，保存到自己的G對象里面。當(dāng)再次輪到自己執(zhí)行時，將自己保存的棧信息復(fù)制到寄存器里面，這樣就接著上次之后運行了。

我這里只是根據(jù)自己的理解進行了簡單的介紹，想要詳細了解有關(guān)GMP的底層原理可以去看Go調(diào)度器 G-P-M 模型的設(shè)計者的文檔或直接看源碼

參考： ()

()

為什么go語言適合開發(fā)網(wǎng)游服務(wù)器端

個人覺得golang十分適合進行網(wǎng)游服務(wù)器端開發(fā)，寫下這篇文章總結(jié)一下。從網(wǎng)游的角度看：要成功的運營一款網(wǎng)游，很大程度上依賴于玩家自發(fā)形成的社區(qū)。只有玩家自發(fā)形成一個穩(wěn)定的生態(tài)系統(tǒng)，游戲才能持續(xù)下去，避免鬼城的出現(xiàn)。而這就需要多次大量導(dǎo)入用戶，在同時在線用戶量達到某個臨界點的時候，才有可能完成。因此，多人同時在線十分有必要。再來看網(wǎng)游的常見玩法，除了排行榜這類統(tǒng)計和數(shù)據(jù)匯總的功能外，基本沒有需要大量CPU時間的應(yīng)用。以前的項目里，即時戰(zhàn)斗產(chǎn)生的各種傷害計算對CPU的消耗也不大。玩家要完成一次操作，需要通過客戶端-服務(wù)器端-客戶端這樣一個來回，為了獲得高響應(yīng)速度，滿足玩家體驗，服務(wù)器端的處理也不能占用太多時間。所以，每次請求對應(yīng)的CPU占用是比較小的。網(wǎng)游的IO主要分兩個方面，一個是網(wǎng)絡(luò)IO，一個是磁盤IO。網(wǎng)絡(luò)IO方面，可以分成美術(shù)資源的IO和游戲邏輯指令的IO，這里主要分析游戲邏輯的IO。游戲邏輯的IO跟CPU占用的情況相似，每次請求的字節(jié)數(shù)很小，但由于多人同時在線，因此并發(fā)數(shù)相當(dāng)高。另外，地圖信息的廣播也會帶來比較頻繁的網(wǎng)絡(luò)通信。磁盤IO方面，主要是游戲數(shù)據(jù)的保存。采用不同的數(shù)據(jù)庫，會有比較大的區(qū)別。以前的項目里，就經(jīng)歷了從MySQL轉(zhuǎn)向MongoDB這種內(nèi)存數(shù)據(jù)庫的過程，磁盤IO不再是瓶頸?？傮w來說，還是用內(nèi)存做一級緩沖，避免大量小數(shù)據(jù)塊讀寫的方案。針對網(wǎng)游的這些特點，golang的語言特性十分適合開發(fā)游戲服務(wù)器端。首先，go語言提供goroutine機制作為原生的并發(fā)機制。每個goroutine所需的內(nèi)存很少，實際應(yīng)用中可以啟動大量的goroutine對并發(fā)連接進行響應(yīng)。goroutine與gevent中的greenlet很相像，遇到IO阻塞的時候，調(diào)度器就會自動切換到另一個goroutine執(zhí)行，保證CPU不會因為IO而發(fā)生等待。而goroutine與gevent相比，沒有了python底層的GIL限制，就不需要利用多進程來榨取多核機器的性能了。通過設(shè)置最大線程數(shù)，可以控制go所啟動的線程，每個線程執(zhí)行一個goroutine，讓CPU滿負載運行。同時，go語言為goroutine提供了獨到的通信機制channel。channel發(fā)生讀寫的時候，也會掛起當(dāng)前操作channel的goroutine，是一種同步阻塞通信。這樣既達到了通信的目的，又實現(xiàn)同步，用CSP模型的觀點看，并發(fā)模型就是通過一組進程和進程間的事件觸發(fā)解決任務(wù)的。雖然說，主流的編程語言之間，只要是圖靈完備的，他們就都能實現(xiàn)相同的功能。但go語言提供的這種協(xié)程間通信機制，十分優(yōu)雅地揭示了協(xié)程通信的本質(zhì)，避免了以往鎖的顯式使用帶給程序員的心理負擔(dān)，確是一大優(yōu)勢。進行網(wǎng)游開發(fā)的程序員，可以將游戲邏輯按照單線程阻塞式的寫，不需要額外考慮線程調(diào)度的問題，以及線程間數(shù)據(jù)依賴的問題。因為，線程間的channel通信，已經(jīng)表達了線程間的數(shù)據(jù)依賴關(guān)系了，而go的調(diào)度器會給予妥善的處理。另外，go語言提供的gc機制，以及對指針的保護式使用，可以大大減輕程序員的開發(fā)壓力，提高開發(fā)效率。展望未來，我期待go語言社區(qū)能夠提供更多的goroutine間的隔離機制。個人十分推崇erlang社區(qū)的脆崩哲學(xué)，推動應(yīng)用發(fā)生預(yù)期外行為時，盡早崩潰，再fork出新進程處理新的請求。對于協(xié)程機制，需要由程序員保證執(zhí)行的函數(shù)不會發(fā)生死循環(huán)，導(dǎo)致線程卡死。

Go語言中恰到好處的內(nèi)存對齊

在開始之前，希望你計算一下 Part1 共占用的大小是多少呢？

輸出結(jié)果：

這么一算， Part1 這一個結(jié)構(gòu)體的占用內(nèi)存大小為 1+4+1+8+1 = 15 個字節(jié)。相信有的小伙伴是這么算的，看上去也沒什么毛病

真實情況是怎么樣的呢？我們實際調(diào)用看看，如下：

輸出結(jié)果：

最終輸出為占用 32 個字節(jié)。這與前面所預(yù)期的結(jié)果完全不一樣。這充分地說明了先前的計算方式是錯誤的。為什么呢？

在這里要提到 “內(nèi)存對齊” 這一概念，才能夠用正確的姿勢去計算，接下來我們詳細的講講它是什么

有的小伙伴可能會認為內(nèi)存讀取，就是一個簡單的字節(jié)數(shù)組擺放

上圖表示一個坑一個蘿卜的內(nèi)存讀取方式。但實際上 CPU 并不會以一個一個字節(jié)去讀取和寫入內(nèi)存。相反 CPU 讀取內(nèi)存是一塊一塊讀取的，塊的大小可以為 2、4、6、8、16 字節(jié)等大小。塊大小我們稱其為內(nèi)存訪問粒度。如下圖：

在樣例中，假設(shè)訪問粒度為 4。 CPU 是以每 4 個字節(jié)大小的訪問粒度去讀取和寫入內(nèi)存的。這才是正確的姿勢

另外作為一個工程師，你也很有必要學(xué)習(xí)這塊知識點哦 :)

在上圖中，假設(shè)從 Index 1 開始讀取，將會出現(xiàn)很崩潰的問題。因為它的內(nèi)存訪問邊界是不對齊的。因此 CPU 會做一些額外的處理工作。如下：

從上述流程可得出，不做 “內(nèi)存對齊” 是一件有點 "麻煩" 的事。因為它會增加許多耗費時間的動作

而假設(shè)做了內(nèi)存對齊，從 Index 0 開始讀取 4 個字節(jié)，只需要讀取一次，也不需要額外的運算。這顯然高效很多，是標(biāo)準(zhǔn)的空間換時間做法

在不同平臺上的編譯器都有自己默認的 “對齊系數(shù)”，可通過預(yù)編譯命令 #pragma pack(n) 進行變更，n 就是代指 “對齊系數(shù)”。一般來講，我們常用的平臺的系數(shù)如下：

另外要注意，不同硬件平臺占用的大小和對齊值都可能是不一樣的。因此本文的值不是唯一的，調(diào)試的時候需按本機的實際情況考慮

輸出結(jié)果：

在 Go 中可以調(diào)用 unsafe.Alignof 來返回相應(yīng)類型的對齊系數(shù)。通過觀察輸出結(jié)果，可得知基本都是 2^n ，最大也不會超過 8。這是因為我手提（64 位）編譯器默認對齊系數(shù)是 8，因此最大值不會超過這個數(shù)

在上小節(jié)中，提到了結(jié)構(gòu)體中的成員變量要做字節(jié)對齊。那么想當(dāng)然身為最終結(jié)果的結(jié)構(gòu)體，也是需要做字節(jié)對齊的

接下來我們一起分析一下，“它” 到底經(jīng)歷了些什么，影響了 “預(yù)期” 結(jié)果

在每個成員變量進行對齊后，根據(jù)規(guī)則 2，整個結(jié)構(gòu)體本身也要進行字節(jié)對齊，因為可發(fā)現(xiàn)它可能并不是 2^n ，不是偶數(shù)倍。顯然不符合對齊的規(guī)則

根據(jù)規(guī)則 2，可得出對齊值為 8。現(xiàn)在的偏移量為 25，不是 8 的整倍數(shù)。因此確定偏移量為 32。對結(jié)構(gòu)體進行對齊

通過本節(jié)的分析，可得知先前的 “推算” 為什么錯誤？

是因為實際內(nèi)存管理并非 “一個蘿卜一個坑” 的思想。而是一塊一塊。通過空間換時間（效率）的思想來完成這塊讀取、寫入。另外也需要兼顧不同平臺的內(nèi)存操作情況

在上一小節(jié)，可得知根據(jù)成員變量的類型不同，其結(jié)構(gòu)體的內(nèi)存會產(chǎn)生對齊等動作。那假設(shè)字段順序不同，會不會有什么變化呢？我們一起來試試吧 :-)

輸出結(jié)果：

通過結(jié)果可以驚喜的發(fā)現(xiàn)，只是 “簡單” 對成員變量的字段順序進行改變，就改變了結(jié)構(gòu)體占用大小

接下來我們一起剖析一下 Part2 ，看看它的內(nèi)部到底和上一位之間有什么區(qū)別，才導(dǎo)致了這樣的結(jié)果？

符合規(guī)則 2，不需要額外對齊

Part2 內(nèi)存布局：ecax|bbbb|dddd|dddd

通過對比 Part1 和 Part2 的內(nèi)存布局，你會發(fā)現(xiàn)兩者有很大的不同。如下：

仔細一看， Part1 存在許多 Padding。顯然它占據(jù)了不少空間，那么 Padding 是怎么出現(xiàn)的呢？

通過本文的介紹，可得知是由于不同類型導(dǎo)致需要進行字節(jié)對齊，以此保證內(nèi)存的訪問邊界

那么也不難理解，為什么調(diào)整結(jié)構(gòu)體內(nèi)成員變量的字段順序就能達到縮小結(jié)構(gòu)體占用大小的疑問了，是因為巧妙地減少了 Padding 的存在。讓它們更 “緊湊” 了。這一點對于加深 Go 的內(nèi)存布局印象和大對象的優(yōu)化非常有幫

go語言有前景嗎？

就目前來看還是很有前景，因為越來越火了，不過他的應(yīng)用領(lǐng)域還是局限在高并發(fā)處理和網(wǎng)站開發(fā)，畢竟是后起之秀所以在其他桌面程序領(lǐng)域沒那么容易普及和超越c++，找工作就不推薦學(xué)go

go是啥語言.

GO語言由Google公司開發(fā)，并于2009年開源，對比Java、Python、C等語言，GO尤其擅長并發(fā)編程，性能堪比C語言，開發(fā)效率比肩Python，被譽為21世紀(jì)的C語言。GO語言在云計算、大數(shù)據(jù)、微服務(wù)、高并發(fā)領(lǐng)域，應(yīng)用非常廣泛。BAT大廠正在把GO作為新項目開發(fā)的首選語言。

當(dāng)前題目：go語言cpu計算 go使用gpu運算
本文網(wǎng)址：http://www.muchs.cn/article46/docsehg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供全網(wǎng)營銷推廣、定制網(wǎng)站、外貿(mào)建站、動態(tài)網(wǎng)站、搜索引擎優(yōu)化、建站公司

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

go語言cpu計算 go使用gpu運算

【golang詳解】go語言GMP(GPM)原理和調(diào)度

為什么go語言適合開發(fā)網(wǎng)游服務(wù)器端

Go語言中恰到好處的內(nèi)存對齊

go語言有前景嗎？

go是啥 語言.

go語言有前景嗎？

go是啥語言.