vmware中APD和PDL的示例分析

小編給大家分享一下vmware中APD和PDL的示例分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

網(wǎng)站建設(shè)公司,為您提供網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)頁設(shè)計及定制網(wǎng)站建設(shè)服務(wù),專注于企業(yè)網(wǎng)站設(shè)計,高端網(wǎng)頁制作,對成都建筑動畫等多個行業(yè)擁有豐富的網(wǎng)站建設(shè)經(jīng)驗的網(wǎng)站建設(shè)公司。專業(yè)網(wǎng)站設(shè)計,網(wǎng)站優(yōu)化推廣哪家好,專業(yè)seo優(yōu)化優(yōu)化,H5建站,響應(yīng)式網(wǎng)站。

APD和PDL的情形在虛擬化運維中,是相對來說比較棘手的問題,需要謹(jǐn)慎處理。

全部路徑異常 (APD):
? 數(shù)據(jù)存儲在“存儲”視圖中顯示為不可用。
? 存儲適配器指示設(shè)備的“操作狀態(tài)”為“不活動或出錯”

永久設(shè)備丟失 (PDL)
? 數(shù)據(jù)存儲在“存儲”視圖中顯示為不可用
? 存儲適配器指示設(shè)備的“操作狀態(tài)”為“通信中斷”

vmware中APD和PDL的示例分析

APD解析:
在 vSphere 4.x 中,如果設(shè)備的所有路徑都出現(xiàn)故障,則將發(fā)生全部路徑異常 (APD) 狀況。 由于沒有跡象表明這是永久性還是暫時性設(shè)備丟失,ESXi 主機會保持重新嘗試建立連接。 當(dāng)從 ESXi/ESX 主機錯誤取消提供 LUN 時,通常會發(fā)生 APD 狀況。 ESXi/ESX 主機仍然認(rèn)為該設(shè)備可用,將無限期重新嘗試所有的 SCSI 命令。 這會對管理代理產(chǎn)生影響,因為在重新可訪問該設(shè)備之前不會對其命令作出響應(yīng)。 這將導(dǎo)致 ESXi/ESX 主機在 vCenter Server 中變得不可訪問/無響應(yīng)。

在 vSphere 5.x/6.x 中,已在永久丟失 (PDL) 的設(shè)備和由于未知原因而發(fā)生全部路徑異常 (APD) 這一暫時性問題的設(shè)備之間進行了明確的區(qū)分。

例如,在 VMkernel 日志中,如果存儲設(shè)備將 SCSI 感知代碼 H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x25 0x0 或 Logical Unit Not Supported 記錄到 ESXi 5.x/6.x 主機中,則表明 ESXi 主機永久不可訪問該設(shè)備,或者該設(shè)備處于永久設(shè)備丟失 (PDL) 狀態(tài)。 ESXi 主機不再嘗試重新建立連接或向該設(shè)備發(fā)出命令。

遇到不可恢復(fù)的硬件錯誤的設(shè)備也會被識別為正處于永久設(shè)備丟失 (PDL) 狀態(tài)。

如果未從設(shè)備返回 PDL SCSI 感知代碼(當(dāng)無法聯(lián)系存儲陣列,或者所具有的存儲陣列未返回受支持的 PDL SCSI 代碼時),則該設(shè)備處于全部路徑異常 (APD) 狀態(tài),ESXi 主機將繼續(xù)發(fā)送 I/O 請求,直到主機收到響應(yīng)。

由于 ESXi 主機無法確定設(shè)備丟失是永久性 (PDL) 還是暫時性 (APD) 的,因此它會無限期重試 SCSI I/O,包括:
? 用戶領(lǐng)域 I/O(hostd 管理代理)
? 虛擬機客戶機 I/O

注意: 如果從客戶機發(fā)出 I/O 請求,則操作系統(tǒng)將超時并中止 I/O。
由于 APD 狀況的性質(zhì),沒有簡便的方法進行恢復(fù)。
? 需要在存儲陣列/結(jié)構(gòu)層來解決 APD 狀況,才能還原與主機的連接。
? 所有受影響的 ESXi 主機都可能需要重新引導(dǎo),以移除到處于 APD 狀態(tài)的受影響設(shè)備的任何殘留引用。
注意:
? 無法對未受影響的虛擬機執(zhí)行 vMotion 遷移,因為管理代理可能會受到 APD 狀況的影響,且 ESXi 主機可能變?yōu)榉鞘芄軤顟B(tài)。 因此,重新引導(dǎo)受影響的 ESXi 主機會強制中斷該主機上所有未受影響的虛擬機。
? vSphere 6.0 和更高版本隨 vSphere HA 一起引入了強大的新功能,稱為虛擬機組件保護 (VMCP)。VMCP 可防止虛擬機出現(xiàn)與存儲相關(guān)的事件,尤其是永久設(shè)備丟失 (PDL) 和全部路徑異常 (APD) 事件。

注意:發(fā)生 APD 事件時,連接到 ESXi 的 LUN 可能會在 LUN 路徑恢復(fù)后仍無法訪問。
即使存儲路徑恢復(fù)后,140 秒的 APD 超時時間可能仍會到期。
在 /var/log/vmkernel.log 文件中,您會依次遇到以下事件:

    設(shè)備進入 APD 狀態(tài)。
    設(shè)備退出 APD 狀態(tài)。
    由于超時或未找到或忙碌,設(shè)備上的檢測信號恢復(fù)和文件系統(tǒng)操作失敗。
    盡管設(shè)備之前已退出 APD 狀態(tài),但是“APD 超時”仍會到期。

此狀況與以下一個或多個行為有關(guān):

    虛擬機無法訪問。
    主機無響應(yīng)。
    即使路徑已恢復(fù)且可用,存儲仍處于脫機狀態(tài)。
    即使虛擬機仍在數(shù)據(jù)存儲上,vSphere Client 也不顯示數(shù)據(jù)存儲。

以下一個或多個事件可能會觸發(fā) APD 事件:

    上游光纖通道或以太網(wǎng)交換鏈路失敗會影響存儲陣列的所有路徑
    存儲陣列故障或重新引導(dǎo)
    存儲陣列固件更新(某些供應(yīng)商)

當(dāng)然并非所有 APD 事件均會出現(xiàn)此行為。 大多數(shù)情況下,LUN 和數(shù)據(jù)存儲會按預(yù)期正常退出 APD 超時狀況。
原因:
出現(xiàn)此問題的原因是 APD 處理時發(fā)生故障。 出現(xiàn)此問題時,LUN 路徑在 APD 事件期間可用且處于聯(lián)機狀態(tài),但 APD 定時器會繼續(xù)計數(shù),直到 LUN 進入“APD 超時”狀態(tài)。 初始 APD 事件后,只要活動工作負(fù)載與數(shù)據(jù)存儲關(guān)聯(lián),該數(shù)據(jù)存儲將無法訪問。

遇到此問題時,必須終止虛擬機才能恢復(fù)數(shù)據(jù)存儲。HA(如果已啟用)應(yīng)在其他主機上恢復(fù)這些虛擬機。如果必須重新啟動管理代理,則暫時將無法通過 vCenter Server 管理主機。

計劃內(nèi) PDL 與計劃外 PDL 解析:
當(dāng)試圖移除向 ESXi 主機提供的設(shè)備時,將發(fā)生計劃內(nèi) PDL。 必須首先卸載數(shù)據(jù)存儲,然后分離設(shè)備,這樣才能在存儲陣列上取消提供該存儲設(shè)備。 有關(guān)如何在 ESXi 5.x 中正確取消提供 LUN 的詳細(xì)信息,請參見 如何從ESXi 主機卸載 LUN 或分離數(shù)據(jù)存儲設(shè)備 (2072353) 。

如果意外從存儲陣列取消提供存儲設(shè)備,而未在 ESXi 主機上執(zhí)行卸載和分離,則將發(fā)生計劃外 PDL。
在 ESXi 5.5 中,VMware 提供了一種名為“自動移除”的功能,以便在計劃外 PDL 期間自動移除設(shè)備。 有關(guān)詳細(xì)信息,請參見 PDL AutoRemove feature in vSphere 5.5 (2059622)。

要清除計劃外 PDL,請執(zhí)行以下操作:

  1. 數(shù)據(jù)存儲中所有運行的虛擬機必須關(guān)閉電源并從 vCenter Server 中取消注冊。

  2. 從 vSphere Client 中,轉(zhuǎn)到 ESXi 主機的配置選項卡,然后單擊存儲。

  3. 右鍵單擊要移除的數(shù)據(jù)存儲,然后單擊卸載。

此時將顯示確認(rèn)卸載數(shù)據(jù)存儲窗口。 如果符合必備條件,則會顯示確定按鈕。

如果您在卸載 LUN 時看到以下錯誤:

在 vCenter Server <name_of_vCenter> 上為對象 <name_of_LUN> 調(diào)用數(shù)據(jù)存儲刷新失敗
(Call datastore refresh for object <name_of_LUN> on vCenter server <name_of_vCenter> failed)

您可能提供了快照 LUN。 要解決此問題,請在陣列端移除該快照 LUN。

  1. 在該 LUN 對其可見的所有 ESXi 主機上執(zhí)行重新掃描。

注意: 如果存在對該設(shè)備或掛起 I/O 的活動引用,ESXi 主機在重新掃描后仍會列出該設(shè)備。 檢查可能仍具有對該設(shè)備或數(shù)據(jù)存儲的活動引用的虛擬機、模板、ISO 映像、軟盤映像和裸設(shè)備映射。

  1. 如果該 LUN 仍在使用中且再次可用,請轉(zhuǎn)到每個主機,右鍵單擊該 LUN,然后單擊掛載。

注意: 計劃外 PDL 的一個可能原因是 LUN 的空間不足,從而導(dǎo)致其變得無法訪問。

Vc 6.0解決方案:
如果啟用虛擬機組件保護 (VMCP),vSphere HA 可以檢測到數(shù)據(jù)存儲可訪問性故障,并為受影響的虛擬機提供自動恢復(fù)。
VMCP 可防止發(fā)生數(shù)據(jù)存儲可訪問性故障,這些故障可能會影響 vSphere HA 群集中主機上正在運行的虛擬機。當(dāng)發(fā)生數(shù)據(jù)存儲可訪問性故障時,受影響的主機無法再訪問特定數(shù)據(jù)存儲的存儲路徑。您可以確定 vSphere HA 將對此類故障作出的響應(yīng),從創(chuàng)建事件警報到虛擬機在其他主機上重新啟動。
注:
使用虛擬機組件保護功能時,ESXi 主機的版本必須為 6.0 或更高版本。
故障類型
存在兩種類型的數(shù)據(jù)存儲可訪問性故障:
PDL
PDL(永久設(shè)備丟失)是在存儲設(shè)備報告主機無法再訪問數(shù)據(jù)存儲時發(fā)生的不可恢復(fù)的可訪問性丟失。如果不關(guān)閉虛擬機的電源,此狀況將無法恢復(fù)。
APD
APD(全部路徑異常)表示暫時性或未知的可訪問性丟失,或 I/O 處理中的任何其他未識別的延遲。此類型的可訪問性問題是可恢復(fù)的。

配置 VMCP
在 vSphere Web Client 中配置虛擬機組件保護。轉(zhuǎn)到配置選項卡并單擊 vSphere 可用性和編輯。在故障和響應(yīng)下,可以選擇處于 PDL 狀態(tài)的數(shù)據(jù)存儲或處于 APD 狀態(tài)的數(shù)據(jù)存儲。您可選擇的存儲保護級別以及可用的虛擬機修復(fù)操作根據(jù)數(shù)據(jù)庫可訪問性故障的類型而異。
PDL 故障
在處于 PDL 狀態(tài)的數(shù)據(jù)存儲下,可以選擇發(fā)布事件或關(guān)閉虛擬機電源再重新啟動虛擬機。
APD 故障
響應(yīng) APD 事件是更加復(fù)雜的,相應(yīng)地配置是更加精細(xì)的??梢赃x擇發(fā)布事件、關(guān)閉虛擬機電源再重新啟動虛擬機 - 保守的重新啟動策略或關(guān)閉虛擬機電源再重新啟動虛擬機 - 激進的重新啟動策略

針對APD和PDL的時間調(diào)度有幾個周期,分別是:

APD說明:

0s - 此時APD會激活時間計數(shù)器;

140s APD - ESXi主機會生命APDTimeout然后會針對故障設(shè)備執(zhí)行NON VM I/O激活Fast Fail動作。這個Timeout的周期可以被修改;

140-320s APD - APD Timeout的時間到達(dá)之后,這之前VMCP的Timeout已經(jīng)到達(dá)。如果故障存儲設(shè)備在這之前恢復(fù)正常,則可以通過對Response for APD recovery after APD timeout配置選項的配置來確保VM不會被強行重置;

320s APD - VMCP Timeout,同時激活Response for Datastore with All Paths Down(APD);

PDL說明:

0s PDL - VMs會立刻在正常ESXi主機上重新啟動;

VMCP的Timeout時間會是320秒,里面包含了APD的默認(rèn)140秒。VMCP組件的配置可以通過勾選vSphereHA設(shè)定選項中Protect against Storage Connectivity Loss選項來激活;

針對VMCP的配置選項如下:

VM restartpriority - VM重啟優(yōu)先級設(shè)定;

Response for Host Isolation - 主機被隔離時的響應(yīng)方式;

Response for Datastore with Permanent Device Losss(PDL) - 三個配置選項,分別是Disabled、Issue events(不激活處理動作,只發(fā)通知訊息)、Power off and restart VMs(針對故障Vms嘗試做重啟動作);

Response for Datastore with All Path Down(APD) - 四個配置選項,分別是Disabled、Issue events(不激活處理動作,只發(fā)通知訊息)、Power off and restart(conservative)(受影響的Vms會被Kill掉,然后在連接正常的ESXi主機上重啟。如果故障主機無法與Master主機通訊則將無法激活)、Power off and restart VMs(aggressive)(受影響的Vms會被Kill掉,無論是否有主機可以通過重啟承載這些Vms。不論Master主機是否存在,是否能和其它主機通訊以及是否有足夠的資源);

Response for APD recovery after APD timeout - 這個選項表示在APDTimeout(140s)之后VMCP Timeout之前(320s)存儲設(shè)備恢復(fù)正常時的處理方式。它有2個可用配置選項,分別是:Disabled、Reset VMs(Vms會被強行于APD發(fā)生前所在主機重置);

注:
如果禁用“主機監(jiān)控”或“虛擬機重新啟動優(yōu)先級”設(shè)置,VMCP 將無法執(zhí)行虛擬機重新啟動。但是,仍可監(jiān)控存儲運行狀況,且可發(fā)布事件。
vmware中APD和PDL的示例分析
vmware中APD和PDL的示例分析

APD的解決方案補充:
此問題已在 ESXi 6.0 Update 1(可從 VMware Downloads 獲得)中得到解決。 有關(guān)詳細(xì)信息,請參見 VMware ESXi 6.0 Update 1 Release Notes。

如果無法升級,沒有其他措施可以保證在 APD 事件期間不會遇到此問題。 但是,出現(xiàn)此問題時有兩種權(quán)宜措施可以恢復(fù)生產(chǎn)。

要臨時解決此問題,請使用以下選項之一:

1、執(zhí)行終止 LUN 的所有未完成 I/O 的過程。 有關(guān)非計劃 PDL 的信息,請參見 Cannot remount a datastore after an unplanned permanent device loss (PDL) (2014155)。

2、 注意: 可能還需要重新啟動 ESXi 管理代理。 有關(guān)詳細(xì)信息,請參見 Restarting the Management agents on an ESXi or ESX host (1003490)。

3、重新引導(dǎo)卷處于“APD 超時”狀態(tài)的所有主機。

其他補充:
腦裂
當(dāng)群集發(fā)生裂腦的狀況時候,因為無法進行任何溝通而誤會對方無法運作,所以主與備份服務(wù)器都會啟動浮動IP和相關(guān)服務(wù),此時若兩部服務(wù)器對外連線亦未短線,那么勢必導(dǎo)致有些使用者存取的是主要服務(wù)器,另外一些則存取備份服務(wù)器的情形。此外,如果兩部服務(wù)器共享一個存儲裝置,發(fā)生裂腦時兩部服務(wù)器會同時掛載該存儲裝置,亦同時存取相同的檔案,因此若共享存儲裝備缺乏良好的鎖定機制,更可能使得存儲裝置上的檔案因同時讀寫而損壞。更有可能導(dǎo)致硬盤中寫入不一致的信息,導(dǎo)致后期數(shù)據(jù)錯誤,甚至整個數(shù)據(jù)庫損壞,后果不堪設(shè)想。
對付HA系統(tǒng)“裂腦”的對策,目前我所了解的大概有以下幾條:
1)添加冗余的心跳線,例如雙線條線。盡量減少“裂腦”發(fā)生機會。
2)啟用磁盤鎖。正在服務(wù)一方鎖住共享磁盤,“裂腦”發(fā)生時,讓對方完全“搶不走”共享磁盤資源。但使用鎖磁盤也會有一個不小的問題,如果占用共享盤的一方不主動“解鎖”,另一方就永遠(yuǎn)得不到共享磁盤。現(xiàn)實中假如服務(wù)節(jié)點突然死機或崩潰,就不可能執(zhí)行解鎖命令。后備節(jié)點也就接管不了共享資源和應(yīng)用服務(wù)。于是有人在HA中設(shè)計了“智能”鎖。即,正在服務(wù)的一方只在發(fā)現(xiàn)心跳線全部斷開(察覺不到對端)時才啟用磁盤鎖。平時就不上鎖了。
3)設(shè)置仲裁機制。例如設(shè)置參考IP(如網(wǎng)關(guān)IP),當(dāng)心跳線完全斷開時,2個節(jié)點都各自ping一下參考IP,不通則表明斷點就出在本端,不僅“心跳”、還兼對外“服務(wù)”的本端網(wǎng)絡(luò)鏈路斷了,即使啟動(或繼續(xù))應(yīng)用服務(wù)也沒有用了,那就主動放棄競爭,讓能夠ping通參考IP的一端去起服務(wù)。更保險一些,ping不通參考IP的一方干脆就自我重啟,以徹底釋放有可能還占用著的那些共享資源。

看完了這篇文章,相信你對“vmware中APD和PDL的示例分析”有了一定的了解,如果想了解更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!

分享題目:vmware中APD和PDL的示例分析
轉(zhuǎn)載源于:http://muchs.cn/article12/geppdc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供商城網(wǎng)站網(wǎng)站排名、網(wǎng)站設(shè)計公司企業(yè)建站、網(wǎng)站策劃、

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)