Exchange故障轉(zhuǎn)移群集網(wǎng)絡(luò)閥值調(diào)優(yōu)

概述  

成都創(chuàng)新互聯(lián)致力于互聯(lián)網(wǎng)網(wǎng)站建設(shè)與網(wǎng)站營(yíng)銷,提供成都網(wǎng)站設(shè)計(jì)、網(wǎng)站建設(shè)、網(wǎng)站開發(fā)、seo優(yōu)化、網(wǎng)站排名、互聯(lián)網(wǎng)營(yíng)銷、微信小程序開發(fā)、公眾號(hào)商城、等建站開發(fā),成都創(chuàng)新互聯(lián)網(wǎng)站建設(shè)策劃專家,為不同類型的客戶提供良好的互聯(lián)網(wǎng)應(yīng)用定制解決方案,幫助客戶在新的全球化互聯(lián)網(wǎng)環(huán)境中保持優(yōu)勢(shì)。

Windows Server故障轉(zhuǎn)移集群是一個(gè)高可用性平臺(tái),它不斷監(jiān)視集群中的網(wǎng)絡(luò)連接和節(jié)點(diǎn)的健康狀況。如果一個(gè)節(jié)點(diǎn)無法通過網(wǎng)絡(luò)訪問,那么將采取恢復(fù)操作來恢復(fù)集群中的另一個(gè)節(jié)點(diǎn)上的應(yīng)用程序和服務(wù),并使其聯(lián)機(jī)。

    

    缺省情況下,故障轉(zhuǎn)移集群被配置為提供最高級(jí)別的可用性,停機(jī)時(shí)間最小。默認(rèn)的開箱即用設(shè)置是針對(duì)服務(wù)器完全丟失的故障進(jìn)行優(yōu)化的,我們將在本博客中稱之為硬故障。這些將是不可恢復(fù)的故障場(chǎng)景,例如非冗余硬件或電源的故障。在這些情況下,服務(wù)器將丟失,而故障轉(zhuǎn)移集群的目標(biāo)是非??焖俚貦z測(cè)服務(wù)器的丟失,并在集群中的另一臺(tái)服務(wù)器上快速恢復(fù)。要從硬故障中實(shí)現(xiàn)這種快速恢復(fù),集群健康監(jiān)測(cè)的默認(rèn)設(shè)置是相當(dāng)積極的。但是,它們是完全可配置的,可以為各種場(chǎng)景提供靈活性。

    這些默認(rèn)設(shè)置為大多數(shù)客戶提供了最佳的行為,但是,當(dāng)集群從幾英寸擴(kuò)展到可能相隔幾英里時(shí),集群可能會(huì)暴露在節(jié)點(diǎn)之間附加的、可能不可靠的網(wǎng)絡(luò)組件中。另一個(gè)因素是,普通服務(wù)器的質(zhì)量在不斷提高,加上通過冗余組件(如雙電源、網(wǎng)卡組和多路徑I/O)增強(qiáng)的彈性,非冗余硬件故障的數(shù)量可能相當(dāng)少。由于硬故障可能不那么頻繁,一些客戶可能希望針對(duì)臨時(shí)故障對(duì)集群進(jìn)行調(diào)優(yōu),此時(shí)集群對(duì)節(jié)點(diǎn)之間的短暫網(wǎng)絡(luò)故障更有彈性。通過增加缺省故障閾值,可以降低對(duì)持續(xù)較短時(shí)間的簡(jiǎn)短網(wǎng)絡(luò)問題的敏感性。


權(quán)衡

重要的是,大家要理解下面提到的權(quán)衡沒有絕對(duì)的答案,優(yōu)化的設(shè)置可能因您的特定業(yè)務(wù)需求和服務(wù)水平協(xié)議而異。

  • 積極監(jiān)控- 提供最快的故障檢測(cè)和硬故障恢復(fù),提供最高級(jí)別的可用性。集群對(duì)瞬態(tài)故障的容忍度較低,在某些情況下,當(dāng)存在瞬態(tài)網(wǎng)絡(luò)中斷時(shí),可能會(huì)過早地進(jìn)行故障轉(zhuǎn)移資源。

  • 放松監(jiān)控 - 提供更寬容的故障檢測(cè),提供更大的容忍度的短暫瞬態(tài)網(wǎng)絡(luò)問題。這些較長(zhǎng)的超時(shí)將導(dǎo)致集群從硬故障中恢復(fù),這將花費(fèi)更多的時(shí)間并增加停機(jī)時(shí)間。


    把它想象成你的手機(jī),當(dāng)電話的另一端沒有聲音時(shí),你愿意坐在那里說“你好”多長(zhǎng)時(shí)間?…你還在聽嗎?…你還在聽嗎??在你掛斷電話給那個(gè)人回電話之前。當(dāng)另一端沉默時(shí),你不知道他們何時(shí)甚至是否會(huì)回來。
你需要問自己的關(guān)鍵問題是:什么對(duì)你更重要?當(dāng)你拔下電源線時(shí),要快速恢復(fù),還是要對(duì)網(wǎng)絡(luò)故障保持容忍度?


設(shè)置

影響集群心跳和節(jié)點(diǎn)間健康檢測(cè)的主要設(shè)置有四種。

  • 延遲- 這定義了在節(jié)點(diǎn)之間發(fā)送集群心跳信號(hào)的頻率。延遲是在發(fā)送下一個(gè)心跳信號(hào)之前的秒數(shù)。在同一個(gè)集群中,同一子網(wǎng)上的節(jié)點(diǎn)之間、不同子網(wǎng)上的節(jié)點(diǎn)之間以及不同故障AD站點(diǎn)上的節(jié)點(diǎn)之間可能存在不同的延遲。

  • 閾值- 這定義了在集群采取恢復(fù)操作之前錯(cuò)過的心跳信號(hào)次數(shù)。閾值是心跳信號(hào)的次數(shù)。在同一個(gè)集群中,同一子網(wǎng)上的節(jié)點(diǎn)之間、不同子網(wǎng)上的節(jié)點(diǎn)之間以及不同故障AD站點(diǎn)上的節(jié)點(diǎn)之間可以有不同的閾值。

    重要的是要理解延遲和閾值對(duì)總體健康檢測(cè)都有累積影響。例如,將cross - subnetdelay設(shè)置為每2秒發(fā)送一次心跳,并將cross - subnetthreshold設(shè)置為在進(jìn)行恢復(fù)之前錯(cuò)過的10次心跳,這意味著在采取恢復(fù)操作之前,集群的總網(wǎng)絡(luò)容忍度可以達(dá)到20秒。一般來說,繼續(xù)發(fā)送頻繁的心跳,但有更大的閾值是首選的方法。增加延遲的主要場(chǎng)景是,節(jié)點(diǎn)之間發(fā)送的數(shù)據(jù)是否有進(jìn)入/退出費(fèi)用。下表列出了用于調(diào)優(yōu)集群心跳的屬性以及默認(rèn)值和最大值。


Exchange故障轉(zhuǎn)移群集網(wǎng)絡(luò)閥值調(diào)優(yōu)

    為了更好地容忍瞬態(tài)故障,建議在Win2008 / Win2008 R2 / Win2012 / Win2012 R2上將相同的ubnetthreshold和cross - subnetthreshold值增加到比Win2016更高些。注意:如果Hyper-V角色安裝在Windows Server 2012 R2故障轉(zhuǎn)移集群上,SameSubnetThreshold默認(rèn)值將自動(dòng)增加到10,而cross - subnetthreshold默認(rèn)值將自動(dòng)增加到20。安裝以下熱修復(fù)程序后,Windows Server 2012 R2上的默認(rèn)心跳值將增加到和Windows Server 2016上的值一樣。

https://support.microsoft.com/en-us/kb/3153887

配置

    集群心跳配置設(shè)置被認(rèn)為是高級(jí)設(shè)置,僅通過PowerShell公開??梢栽诩?jiǎn)?dòng)并運(yùn)行時(shí)設(shè)置這些設(shè)置,而不需要停機(jī),并且將立即生效,不需要重新啟動(dòng)或重新啟動(dòng)集群。
要查看當(dāng)前心跳配置值:

PS C:\> get-cluster | fl *subnet*

Exchange故障轉(zhuǎn)移群集網(wǎng)絡(luò)閥值調(diào)優(yōu)

可以使用以下語法修改設(shè)置:

PS C:\> (get-cluster).SameSubnetThreshold = 20

Exchange故障轉(zhuǎn)移群集網(wǎng)絡(luò)閥值調(diào)優(yōu)


日志記錄的其他注意事項(xiàng)

    在Windows Server 2012中,在Cluster.log中有額外的日志記錄,用于記錄心跳停止時(shí)的心跳流量。默認(rèn)情況下,RouteHistoryLength設(shè)置為10,這是默認(rèn)閾值數(shù)量的兩倍。如果您增加了SameSubnetThreshold或CrossSubnetThrehold值,建議將RouteHistoryLength值增加到該值的兩倍,以確保在需要排除正在丟棄的心跳包的故障時(shí),有足夠的日志記錄。這可以通過以下語法實(shí)現(xiàn):

PS C:\> (get-cluster).RouteHistoryLength = 20

有關(guān)因網(wǎng)絡(luò)通信問題而從集群成員中刪除節(jié)點(diǎn)的故障排除問題的更多信息,請(qǐng)參見以下博客:

http://blogs.technet.com/b/askcore/archive/2012/02/08/having-a-problem-with-nodes-being-removed-from-active-failover-cluster-membership.aspx

網(wǎng)站名稱:Exchange故障轉(zhuǎn)移群集網(wǎng)絡(luò)閥值調(diào)優(yōu)
網(wǎng)站路徑:http://muchs.cn/article26/ihigjg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作商城網(wǎng)站、云服務(wù)器、網(wǎng)站維護(hù)外貿(mào)建站、企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

綿陽服務(wù)器托管