記一次服務(wù)器宕機(jī)處理過(guò)程-創(chuàng)新互聯(lián)

今天整理之前的運(yùn)維資料,發(fā)現(xiàn)了自己整理的一次刀片服務(wù)器(運(yùn)行的vmware虛擬化)事故處理流程,所以記錄下,備忘。

創(chuàng)新互聯(lián)建站專注于網(wǎng)站建設(shè),為客戶提供成都做網(wǎng)站、網(wǎng)站制作、網(wǎng)頁(yè)設(shè)計(jì)開發(fā)服務(wù),多年建網(wǎng)站服務(wù)經(jīng)驗(yàn),各類網(wǎng)站都可以開發(fā),成都品牌網(wǎng)站建設(shè),公司官網(wǎng),公司展示網(wǎng)站,網(wǎng)站設(shè)計(jì),建網(wǎng)站費(fèi)用,建網(wǎng)站多少錢,價(jià)格優(yōu)惠,收費(fèi)合理。

一、事件處理過(guò)程

14:10 接到機(jī)房運(yùn)維工程師通知,Opmanager監(jiān)控系統(tǒng)上出現(xiàn)了多臺(tái)服務(wù)器宕機(jī)現(xiàn)象,并且均為虛擬機(jī)。

14:12 通知機(jī)房運(yùn)維工程師檢查HP刀片服務(wù)器是否有告警,遠(yuǎn)程登錄vcenter進(jìn)行檢查。遠(yuǎn)程查看發(fā)現(xiàn)ESX04(10.203.11.64)出現(xiàn)告警,告警信息如下圖所示:

記一次服務(wù)器宕機(jī)處理過(guò)程 14:15 通知工程師ESX04出現(xiàn)告警,然后確認(rèn)該刀片服務(wù)器是否存活,并進(jìn)入機(jī)房確認(rèn)設(shè)備上是否有硬件上的告警。

記一次服務(wù)器宕機(jī)處理過(guò)程

14:16 檢查邏輯上的網(wǎng)絡(luò)接口是否存在異常

記一次服務(wù)器宕機(jī)處理過(guò)程

如下圖所示,發(fā)現(xiàn)有兩塊網(wǎng)卡處于離線狀態(tài)

記一次服務(wù)器宕機(jī)處理過(guò)程

14:18 檢查其它刀片,發(fā)現(xiàn)ESXI02對(duì)應(yīng)的網(wǎng)卡,發(fā)現(xiàn)為正常的

記一次服務(wù)器宕機(jī)處理過(guò)程

14:20 登錄HP刀片管理控制臺(tái)查看,未發(fā)現(xiàn)服務(wù)器告警信息。

記一次服務(wù)器宕機(jī)處理過(guò)程

14:19 參照其它EXSI,嘗試更改vmnic6、vmnic7兩塊網(wǎng)卡模式,該操作無(wú)法生效

記一次服務(wù)器宕機(jī)處理過(guò)程

更改網(wǎng)卡模式無(wú)法生效

記一次服務(wù)器宕機(jī)處理過(guò)程

14:27 在ESX04進(jìn)行手動(dòng)遷移虛擬機(jī)到其他主機(jī)上,遷移失敗。

記一次服務(wù)器宕機(jī)處理過(guò)程

14:58 將ESX04主機(jī)上的虛擬機(jī)全部關(guān)機(jī)

記一次服務(wù)器宕機(jī)處理過(guò)程

15:20 重啟ESXI主機(jī),HA 自動(dòng)將開著的虛擬機(jī)遷移到其他EXSI主機(jī)上啟動(dòng)

15:30 ESX04主機(jī)啟動(dòng)成功后,vsphereHA嘗試自動(dòng)將虛擬機(jī)遷移回ESX04主機(jī)失敗,

15:50 手動(dòng)遷移部分虛擬機(jī)回ESX04主機(jī),觀察運(yùn)行狀態(tài)。

二、日志分析

1、遠(yuǎn)程登錄到ESXI的命令行,查看vmkernel的日志:

說(shuō)明:由于esxi4采用的是utc時(shí)間,日志中顯示的較時(shí)間時(shí)間會(huì)慢8小時(shí)

/var/log # cat /var/log/vmkernel.log | grep '2014-12-18' 2014-12-18T03:27:49.106Zcpu46:6396479)WARNING: ScsiDeviceIO: 1211: Devicenaa.60014380064900f30000800000e40000 performance hasdeteriorated. I/O latency increased from average value of 3303 microseconds to68755 microseconds. 2014-12-18T03:31:54.595Zcpu8:16392)ScsiDeviceIO: 1191: Device naa.60014380064900f30000800000e40000performance has improved. I/O latency reduced from 68755 microseconds to 13691microseconds. 2014-12-18T03:32:32.643Zcpu12:17017)MigrateNet: vm 17017: 2061: Accepted connection from <10.203.11.100> 2014-12-18T03:32:32.643Zcpu12:17017)MigrateNet: vm 17017: 2131: dataSocket 0x4100253292f0 receivebuffer size is 563560 2014-12-18T03:32:32.644Z cpu12:17017)WARNING:Migrate: 262: Invalid message type for new connection: 542393671.  Expecting message

如上面的日志顯示:13:27,主機(jī)的性能開始下降,I/O延遲變的較大

2、查看10.203.11.100是否有相關(guān)告警:

記一次服務(wù)器宕機(jī)處理過(guò)程如上圖所示,提示esx04主機(jī)的網(wǎng)卡狀態(tài)出現(xiàn)錯(cuò)誤

記一次服務(wù)器宕機(jī)處理過(guò)程

3、收集的其它日志如下,暫未發(fā)現(xiàn)異常

記一次服務(wù)器宕機(jī)處理過(guò)程

整個(gè)處理過(guò)程到此基本完成,所有的刀片服務(wù)器中,也就這臺(tái)偶爾抽風(fēng),也沒(méi)有明顯的特征

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。

本文名稱:記一次服務(wù)器宕機(jī)處理過(guò)程-創(chuàng)新互聯(lián)
網(wǎng)站網(wǎng)址:http://muchs.cn/article46/ioghg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站企業(yè)網(wǎng)站制作網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)公司、品牌網(wǎng)站建設(shè)、ChatGPT

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

小程序開發(fā)