2024-03-19 分類: 網(wǎng)站建設(shè)
您在垃圾填埋場工作的時間越長,氣味對您的警覺就越少。當(dāng)沒有任何問題時,您的網(wǎng)絡(luò)監(jiān)控系統(tǒng)儀表板以紅色和黃色點(diǎn)亮的時間越長,警報對您的意義就越小。配置您的網(wǎng)絡(luò)監(jiān)視器警報閾值,使紅色真正意味著“現(xiàn)在做點(diǎn)什么”。我們的一位高級服務(wù)工程師 (SE) 在安裝網(wǎng)絡(luò)監(jiān)控系統(tǒng)后不久就拜訪了一位客戶??粗蛻舻膬x表板,SE 看到了一些罕見而美妙的東西。
他對客戶說:“您主頁上的所有內(nèi)容都是綠色的。這正常嗎?一切(即監(jiān)控系統(tǒng))工作正常嗎?”“哦耶。我在這附近經(jīng)營著一艘非常緊張的船,”客戶回答道。“我知道應(yīng)該監(jiān)控什么以及何時監(jiān)控?!罢\然,該客戶端幾乎沒有大型客戶端維護(hù)的網(wǎng)絡(luò)規(guī)模,在任何給定時間都不太可能有零警報。但是客戶的觀點(diǎn)仍然有效。正確配置的警報是必不可少的,配置不當(dāng)?shù)木瘓罂赡鼙葲]有警報更糟糕。
這里有 5 種方法可以確保您的警報正在執(zhí)行您支付的費(fèi)用:
1. 清點(diǎn)您的設(shè)備(必要時獲得幫助),以確保您可以看到您需要它的地方 - 并且只在您需要的地方。
在解決警報閾值之前,請確定您是否甚至需要監(jiān)控給定的設(shè)備或系統(tǒng)。正如我在上一篇關(guān)于為監(jiān)控系統(tǒng)安裝準(zhǔn)備網(wǎng)絡(luò)的文章中提到的,您可以使用“自動發(fā)現(xiàn)”工具來清點(diǎn)系統(tǒng)和設(shè)備。我們有客戶告訴我們,自動發(fā)現(xiàn)過程幫助他們識別了一些他們沒有意識到他們可以如此輕松地監(jiān)控的關(guān)鍵設(shè)備。現(xiàn)在,他們發(fā)現(xiàn)了解這些設(shè)備非常有用。
對于其他客戶,最好手動清點(diǎn)他們的網(wǎng)絡(luò),通常是在我們 SE 的幫助下。這可以幫助您識別您可能不需要監(jiān)控的設(shè)備。你知道,就像那個已經(jīng)“關(guān)鍵”了 250 天的來賓虛擬機(jī),但實(shí)際上其中 249 天可能并不存在?請記住,如果您使用具有預(yù)設(shè)警報閾值的自動發(fā)現(xiàn)功能,您可能需要立即調(diào)整閾值。對于您不立即調(diào)整的閾值,請在它們運(yùn)行幾周左右后留出時間進(jìn)行審查。確保你有你認(rèn)為你有的知名度。
2. 確定每個警報將直接通知誰,以及如何通知他們。
如果您有生成操作項通信的警報,請確保只有需要對警報采取行動的人(可能連同備份和/或直接主管一起)接收電子郵件、文本等。與儀表板警報一樣,一個裝滿無關(guān)通知的收件箱只會訓(xùn)練人們忽略所有警報,包括他們應(yīng)該采取行動的警報。
3. 考慮將警報從單個設(shè)備監(jiān)控工具遷移到一個集成監(jiān)控系統(tǒng)中。
作為 OmniCenter 的創(chuàng)建者,我們顯然相信全面的監(jiān)控、警報和報告設(shè)備。然而,我并不是說某些設(shè)備的專有監(jiān)控工具或?yàn)榛A(chǔ)設(shè)施的特定元素構(gòu)建的本土工具沒有用處。關(guān)鍵是不要讓這些不同的工具以大多數(shù)工作人員不完全理解并且不能始終正確響應(yīng)的警報形式產(chǎn)生噪音。
不同工具的報警系統(tǒng)可能使用不同的協(xié)議來輪詢他們的設(shè)備。每個都可能有不同的 UI。這可能會迫使您在網(wǎng)絡(luò)管理操作中不必要地創(chuàng)建孤島。綜合監(jiān)控系統(tǒng)促進(jìn)了更多跨職能、更靈活的工作人員。您可以避免服務(wù)瓶頸(以及隨之而來的不可避免的指責(zé))。
使用 SNMP 輪詢每臺設(shè)備的管理系統(tǒng)使您能夠了解整個基礎(chǔ)架構(gòu),包括您無法通過代理管理的設(shè)備。例如,SNMP 可以向您顯示沒有操作系統(tǒng)的設(shè)備(如交換機(jī)端口或 UPS 電池)的利用率。無論您決定需要警報配置的設(shè)備,您都應(yīng)該能夠使用單一、連貫的 UI 來概覽所有設(shè)備。
4. 配置警報閾值以發(fā)現(xiàn)重大異常,而不是可預(yù)測和/或瞬時峰值。
正如我在一篇關(guān)于發(fā)現(xiàn)隱藏在虛擬化網(wǎng)絡(luò)中的異常的帖子中所描述的,靜態(tài)閾值(例如服務(wù)器 CPU 或內(nèi)存)可能會產(chǎn)生誤導(dǎo)性警報。一個典型的例子是 SQL 數(shù)據(jù)庫服務(wù)器。它可能每天四次達(dá)到 100% CPU,但您并不真的希望每次發(fā)生這種情況時都收到警報。您真正需要知道的是它何時表現(xiàn)異常。
也許在周五上午 10 點(diǎn),它通常以 80% 的速度運(yùn)行,但本周五同時以 20% 的速度運(yùn)行。這可能表明您的應(yīng)用程序或用戶存在問題 - 但不會觸發(fā)靜態(tài)警報。通過異常檢測,您將收到警報,以便您了解發(fā)生了什么。
或者你可能有一些用戶通常不會使用超過 20% 的端口帶寬,而現(xiàn)在他們正在使用 70% — 仍然可能不足以觸發(fā)靜態(tài)“高水位”閾值,但絕對應(yīng)該這樣做調(diào)查。如果您的監(jiān)控系統(tǒng)只是在尋找固定的閾值,您可能看不到全貌。這取決于設(shè)備的常規(guī)工作負(fù)載。
5. 盡可能自動化為新設(shè)備預(yù)先設(shè)置閾值的過程。
一旦您清點(diǎn)了您的系統(tǒng),將所有需要的設(shè)備映射到您的監(jiān)控系統(tǒng)并自定義了閾值,您的警報管理工作就完成了。只是在開玩笑。只要您的網(wǎng)絡(luò)不斷變化和增長,它就永遠(yuǎn)不會完成,對嗎?但是你可以讓這項工作更容易向前推進(jìn)。
根據(jù)您已設(shè)置的參數(shù),配置您的網(wǎng)絡(luò)監(jiān)控系統(tǒng)以預(yù)設(shè)特定設(shè)備類別的警報閾值。即使新設(shè)備通常不需要與設(shè)備類別完全相同的警報參數(shù),也可能會接近預(yù)設(shè)閾值。如果不立即重新配置設(shè)備的警報,您至少會獲得一些保護(hù)。而且您可能會發(fā)現(xiàn),大多數(shù)情況下預(yù)設(shè)的閾值都是正確的。這是你自己經(jīng)營一艘非常緊張的船的明顯跡象之一。
本文標(biāo)題:5種方法可以確保您的警報正在執(zhí)行您支付的費(fèi)用
本文URL:http://muchs.cn/news49/320849.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計、網(wǎng)站設(shè)計公司、軟件開發(fā)、App設(shè)計、網(wǎng)站排名、網(wǎng)站導(dǎo)航
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容