服務(wù)器負載是什么意思

這篇文章主要介紹“負載是什么意思”,在日常操作中,相信很多人在服務(wù)器負載是什么意思問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”服務(wù)器負載是什么意思”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!

這篇文章主要介紹“負載是什么意思”,在日常操作中,相信很多人在服務(wù)器負載是什么意思問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”服務(wù)器負載是什么意思”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!

成都創(chuàng)新互聯(lián)公司長期為上1000家客戶提供的網(wǎng)站建設(shè)服務(wù),團隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為平武企業(yè)提供專業(yè)的網(wǎng)站設(shè)計、網(wǎng)站制作,平武網(wǎng)站改版等技術(shù)服務(wù)。擁有十余年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。

平常的工作中,在衡量服務(wù)器的性能時,經(jīng)常會涉及到幾個指標,load、cpu、mem、qps、rt等。每個指標都有其獨特的意義,很多時候在線上出現(xiàn)問題時,往往會伴隨著某些指標的異常。大部分情況下,在問題發(fā)生之前,某些指標就會提前有異常顯示。

對于這些指標的理解和查看、異常解決等,是程序員們重要的必備技能。本文,主要來介紹一下一個比較重要的指標——機器負載(Load),主要涉及負載的定義、查看負載方式、負載飆高排查思路等。

什么是負載

隨著 Internet 的快速發(fā)展和業(yè)務(wù)量的不斷提高,基于網(wǎng)絡(luò)的數(shù)據(jù)訪問流量迅速增長,特別是對數(shù)據(jù) 中心、大型企業(yè)以及門戶網(wǎng)站等的訪問,其訪問流量甚至達到了 10Gb/s 的級別;同時,服務(wù)器網(wǎng) 站借助 HTTP、FTP、SMTP 等應(yīng)用程序,為訪問者提供了越來越豐富的內(nèi)容和信息,服務(wù)器逐漸 被數(shù)據(jù)淹沒;另外,大部分網(wǎng)站(尤其電子商務(wù)等網(wǎng)站)都需要提供不間斷 24 小時服務(wù),任何服 務(wù)中斷或通信中的關(guān)鍵數(shù)據(jù)丟失都會造成直接的商業(yè)損失。所有這些都對應(yīng)用服務(wù)提出了高性能和 高可靠性的需求,這些海量的訪問數(shù)據(jù)均是負載。

查看機器負載

在Linux機器上,有多個命令都可以查看機器的負載信息。其中包括uptime 、top、w 等。

uptime命令

命令能夠打印系統(tǒng)總共運行了多長時間和系統(tǒng)的平均負載。uptime命令可以顯示的信息顯示依次為:現(xiàn)在時間、系統(tǒng)已經(jīng)運行了多長時間、目前有多少登陸用戶、系統(tǒng)在過去的1分鐘、5分鐘和15分鐘內(nèi)的平均負載。

? ~uptime13:29 up23:41, 3users,loadaverages: 1.741.871.97

這行信息的后半部分,顯示"load average",它的意思是"系統(tǒng)的平均負荷",里面有三個數(shù)字,我們可以從中判斷系統(tǒng)負荷是大還是小。

1.74 1.87 1.97 這三個數(shù)字的意思分別是1分鐘、5分鐘、15分鐘內(nèi)系統(tǒng)的平均負荷。我們一般表示為load1、load5、load15。

w命令

w命令的主要功能其實是顯示目前登入系統(tǒng)的用戶信息。但是與who不同的是,w命令功能更加強大,w命令還可以顯示:當(dāng)前時間,系統(tǒng)啟動到現(xiàn)在的時間,登錄用戶的數(shù)目,系統(tǒng)在最近1分鐘、5分鐘和15分鐘的平均負載。然后是每個用戶的各項數(shù)據(jù),項目顯示順序如下:登錄帳號、終端名稱、遠 程主機名、登錄時間、空閑時間、JCPU、PCPU、當(dāng)前正在運行進程的命令行。

? ~w14:08 up23:41, 3users,loadaverages: 1.741.871.97USER TTY FROM LOGIN@ IDLE WHAThollis console - 六14 23:40-hollis s000 - 六14 20:24-zshhollis s001 - 六15 - w

從上面的w命令的結(jié)果可以看到,當(dāng)前系統(tǒng)時間是14:08,系統(tǒng)啟動到現(xiàn)在經(jīng)歷了23小時41分鐘,共有3個用戶登錄。系統(tǒng)在近1分鐘、5分鐘和15分鐘的平均負載分別是1.74 1.87 1.97。這和uptime得到的結(jié)果相同。 下面還打印了一些登錄的用戶的各項數(shù)據(jù),不詳細介紹了。

top命令

top命令是Linux下常用的性能分析工具,能夠?qū)崟r顯示系統(tǒng)中各個進程的資源占用狀況,類似于Windows的任務(wù)管理器。

? ~topProcesses:244total,3running,9stuck,232sleeping,1484threads14:16:01LoadAvg:1.74,1.87,1.97 CPUusage:8.0%user,6.79%sys,85.19%idle SharedLibs:116Mresident,16Mdata,14Mlinkedit.MemRegions:66523total,2152Mresident,50Mprivate,930Mshared.PhysMem:7819Mused(1692M wired),370Munused.VM:682Gvsize,533Mframeworkvsize,6402060(0)swapins,7234356(0)swapouts.Networks:packets:383006/251Min,334448/60Mout.Disks:1057821/38Gread,350852/40Gwritten.PID COMMAND %CPUTIME #TH #WQ #PORTMEM PURG CMPRS PGRP PPID STATE BOOSTS %CPU_ME%CPU_OTHRSUID FAULTS COW MSGSENT MSGRECV SYSBSD SYSMACH CSW30845 top 3.0 00:00.491/1 0 21 3632K 0B 0B 308451394 running *0[1] 0.000000.00000 0 3283+ 112 203556+ 101770+ 8212+ 119901+ 823+30842 GoogleChrom0.0 00:47.3917 0 155 130M 0B 0B 1146 1146 sleeping*0[1] 0.000000.00000 501 173746 2697 117678 37821 364228 444830 310043

上面的輸出結(jié)果中,Load Avg: 1.74, 1.87, 1.97顯示的就是負載信息。

機器正常負載范圍

對于機器的Load到底多少算正常的問題,一直都是很有爭議的,不同人有著不同的理解。對于單個CPU,有人認為如果Load超過0.7就算是超出正常范圍了。也有人認為只要不超過1都沒問題。也有人認為,單個CPU的負載在2以下都可以接受。

為什么會有這么多不同的理解呢,是因為不同的機器除了CPU影響之外還有其他因素的影響,運行的程序、機器內(nèi)存、甚至是機房溫度等都有可能有區(qū)別。

比如,有些機器用于定時執(zhí)行大量的跑批任務(wù),這個時間段內(nèi),Load可能會飆的比較高。而其他時間可能會比較低。那么這段飆高時間我們要不要去排查問題呢?

我的建議是,最好根據(jù)自己機器的實際情況,建立一個指標的基線(如近一個月的平均值),只要日常的load在基線上下范圍內(nèi)不太大都可以接收,如果差距太多可能就要人為介入檢查了。

如何降低負載

導(dǎo)致負載高的原因可能很復(fù)雜,有可能是硬件問題也可能是軟件問題。

如果是硬件問題,那么說明機器性能確實就不行了,那么解決起來很簡單,直接換機器就可以了。

前面我們提過,CPU使用、內(nèi)存使用、IO消耗都可能導(dǎo)致負載高。如果是軟件問題,有可能由于Java中的某些線程被長時間占用、大量內(nèi)存持續(xù)占用等導(dǎo)致。建議從以下幾個方面排查代碼問題:

1、是否有內(nèi)存泄露導(dǎo)致頻繁GC

2、是否有死鎖發(fā)生

3、是否有大字段的讀寫

4、會不會是數(shù)據(jù)庫操作導(dǎo)致的,排查SQL語句問題。

這里還有個建議,如果發(fā)現(xiàn)線上機器Load飆高,可以考慮先把堆棧內(nèi)存dump下來后,進行重啟,暫時解決問題,然后再考慮回滾和排查問題。

Java Web應(yīng)用Load飆高排查思路

1、使用uptime查看當(dāng)前l(fā)oad,發(fā)現(xiàn)load飆高。

2、使用top命令,查看占用CPU較高的進程ID。

3、使用 top命令,查看具體是哪個線程占用率較高

4、使用printf 命令查看這個線程的16進制

5、還可以使用jstat()來查看GC情況,看看是否有頻繁FGC,然后再使用jmap來dump內(nèi)存,查看是否存在內(nèi)存泄露。

新聞標題:服務(wù)器負載是什么意思
文章鏈接:http://www.muchs.cn/article38/ehscpp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制開發(fā)、品牌網(wǎng)站設(shè)計、品牌網(wǎng)站制作、電子商務(wù)、品牌網(wǎng)站建設(shè)、全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

手機網(wǎng)站建設(shè)