OOM問題排查的示例分析

小編給大家分享一下OOM問題排查的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

成都創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),東勝企業(yè)網(wǎng)站建設(shè),東勝品牌網(wǎng)站建設(shè),網(wǎng)站定制,東勝網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營(yíng)銷,網(wǎng)絡(luò)優(yōu)化,東勝網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競(jìng)爭(zhēng)力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長(zhǎng)自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。

運(yùn)維反饋線上程序出現(xiàn)了OOM,程序日志中的輸出為

Exception in thread "http-nio-8080-exec-1027" java.lang.OutOfMemoryError: Java heap space
Exception in thread "http-nio-8080-exec-1031" java.lang.OutOfMemoryError: Java heap space

看線程名稱應(yīng)該是tomcat的nio工作線程,線程在處理程序的時(shí)候因?yàn)闊o法在堆中分配更多內(nèi)存出現(xiàn)了OOM,幸好JVM啟動(dòng)參數(shù)配置了-XX:+HeapDumpOnOutOfMemoryError,使用MAT打開拿到的hprof文件進(jìn)行分析。

第一步就是打開Histogram看看占用內(nèi)存最大的是什么對(duì)象:

OOM問題排查的示例分析

可以看到byte數(shù)組占用了接近JVM配置的最大堆的大小也就是8GB,顯然這是OOM的原因。

第二步看一下究竟是哪些byte數(shù)組,數(shù)組是啥內(nèi)容:

OOM問題排查的示例分析

可以看到很明顯這和HTTP請(qǐng)求相關(guān),一個(gè)數(shù)組大概是10M的大小。

第三步通過查看GC根查看誰持有了數(shù)組的引用:

OOM問題排查的示例分析

這符合之前的猜測(cè),是tomcat的線程在處理過程中分配了10M的buffer在堆上。至此,馬上可以想到一定是什么參數(shù)設(shè)置的不合理導(dǎo)致了這種情況,一般而言tomcat不可能為每一個(gè)請(qǐng)求分配如此大的buffer。

第四步就是檢查代碼里是否有tomcat或服務(wù)器相關(guān)配置,看到有這么一個(gè)配置:

max-http-header-size: 10000000

至此,基本已經(jīng)確定了八九不離十就是這個(gè)不合理的最大http請(qǐng)求頭參數(shù)導(dǎo)致的問題。

到這里還有3個(gè)疑問:

  • 即使一個(gè)請(qǐng)求分配10M內(nèi)存,堆有8GB,難道當(dāng)時(shí)有這么多并發(fā)嗎?800個(gè)tomcat線程?

  • 參數(shù)只是設(shè)置了最大請(qǐng)求頭10M,為什么tomcat就會(huì)一次性分配這么大的buffer呢?

  • 為什么會(huì)有如此多的tomcat線程?感覺程序沒這么多并發(fā)。

先來看問題1,這個(gè)可以通過MAT在dump中繼續(xù)尋找答案。

可以打開線程視圖,搜索一下tomcat的工作線程,發(fā)現(xiàn)線程數(shù)量的確很多有401個(gè),但是也只是800的一半:

OOM問題排查的示例分析

再回到那些大數(shù)組的清單,按照堆分配大小排序,往下看:

OOM問題排查的示例分析

可以發(fā)現(xiàn)除了有10008192字節(jié)的數(shù)組還有10000000字節(jié)的數(shù)組,查看引用路徑可以看到這個(gè)正好是10M的數(shù)組是output buffer,區(qū)別于之前看到的input buffer:

OOM問題排查的示例分析

好吧,這就對(duì)了,一個(gè)線程分配了輸入輸出兩個(gè)buffer,占用20M內(nèi)存,一共401個(gè)線程,占用8GB,所以O(shè)OM了。
還引申出一個(gè)問題為啥有這么多工作線程,

再來看看問題2,這就需要來找一下源碼了,首先max-http-header-size是springboot定義的參數(shù),查看springboot代碼可以看到這個(gè)參數(shù)對(duì)于tomcat設(shè)置的是MaxHttpHeaderSize:

OOM問題排查的示例分析

然后來看看tomcat源碼:

OOM問題排查的示例分析

進(jìn)一步看一下input buffer:

OOM問題排查的示例分析

buffer大小是MaxHttpHeaderSize+ReadBuffer大小,這個(gè)默認(rèn)是8192字節(jié):

 <attribute name="socket.appReadBufSize" required="false">
  <p>(int)Each connection that is opened up in Tomcat get associated with
  a read ByteBuffer. This attribute controls the size of this buffer. By
  default this read buffer is sized at <code>8192</code> bytes. For lower
  concurrency, you can increase this to buffer more data. For an extreme
  amount of keep alive connections, decrease this number or increase your
  heap size.</p>
  </attribute>

這也就是為什么之前看到大量的buffer是10008192字節(jié)的。至于為什么分配的buffer需要是MaxHttpHeaderSize+ReadBuffer。顯然還有一批內(nèi)容是空的10000000字節(jié)的buffer應(yīng)該是output buffer,源碼可以印證這點(diǎn):

OOM問題排查的示例分析

嗯這是一個(gè)header buffer,所以正好是10000000字節(jié)。

至于問題3,顯然我們的應(yīng)用程序是配置過最大線程的(查看配置后發(fā)現(xiàn)的確,我們配置為了2000,好吧有點(diǎn)大),否則也不會(huì)有401個(gè)工作線程(默認(rèn)150),如果當(dāng)時(shí)并發(fā)并不大的話就一種可能,請(qǐng)求很慢,雖然并發(fā)不大,但是因?yàn)檎?qǐng)求執(zhí)行的慢就需要更多線程,比如TPS是100,但是平均RT是4s的話,就是400線程了。這個(gè)問題的答案還是可以通過MAT去找,隨便看幾個(gè)線程可以發(fā)現(xiàn)很多線程都在等待一個(gè)外部服務(wù)的返回,這說明外部服務(wù)比較慢,去搜索當(dāng)時(shí)的程序日志可以發(fā)現(xiàn)有很多"feign.RetryableException: Read timed out executing的日志"。。。。追殺下游去!慢點(diǎn),我們的feign的timeout也需要再去設(shè)置一下,別被外部服務(wù)拖死了。

以上是“OOM問題排查的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

分享題目:OOM問題排查的示例分析
標(biāo)題URL:http://muchs.cn/article24/jpigce.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、網(wǎng)站制作動(dòng)態(tài)網(wǎng)站、Google、商城網(wǎng)站、網(wǎng)站設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作