從爐石傳說數(shù)據(jù)庫故障看數(shù)據(jù)備份策略

2021-03-19    分類: 網(wǎng)站建設(shè)

最近爐石傳說的數(shù)據(jù)庫故障在業(yè)界傳得沸沸揚揚。無論故障起因是掉電宕機還是人為失誤,最終的影響是極其惡劣的,造成了無法挽回的數(shù)據(jù)丟失。對于越是大規(guī)模的數(shù)據(jù)庫系統(tǒng),如何設(shè)計一個可靠的備份系統(tǒng)越是至關(guān)重要。
從爐石傳說數(shù)據(jù)庫故障看數(shù)據(jù)備份策略
大型數(shù)據(jù)備份系統(tǒng)設(shè)計備案策略
1.如何根據(jù)業(yè)務(wù)類型選擇備份方式,邏輯備份or物理備份?

3.如何確認備份是否成功,哪一步驟出了問題

5.需要恢復(fù)時,如何做到一鍵恢復(fù)到指定時間點

再比如mysqldump邏輯備份時沒有考慮到部分表采用utf8mb4字符集,導致恢復(fù)后的數(shù)據(jù)庫亂碼情況等。以UDB為例,大型備份系統(tǒng)主要從以下幾個方面確保備份安全性:
從爐石傳說數(shù)據(jù)庫故障看數(shù)據(jù)備份策略
1.備份失敗監(jiān)控,一旦備份失敗就會發(fā)送告警信息

3.備份上傳前后的MD5校驗

5.備份周期選擇上確保兩次間隔的binlog未過期

7.備份機集群空間檢測和負載均衡,確??臻g富余

其中,備份的有效性測試方法大概是這樣的:啟幾個對應(yīng)版本的數(shù)據(jù)庫并行測試,通過備份詳細記錄表獲取備份后將其傳送到這幾個實例進行恢復(fù)測試。

備份過程的全局讀鎖檢測,是因為備份過程中為了記錄當前的pos點信息,都會執(zhí)行一個flush tables with read lock的操作,但是如果當時有長SQL未執(zhí)行完就會導致全局鎖等待,從而阻塞后續(xù)的所有寫請求。

這些備份的常規(guī)檢測都會在備份系統(tǒng)后臺定期全自動執(zhí)行,保證了備份的成功率。

這種情況下由于無法獲取最實時的binlog,僅僅通過歷史備份只能恢復(fù)到備份時間點,而無法恢復(fù)到故障前的時間點。

UDB出于客戶配置靈活,經(jīng)濟成本的考慮,既支持只創(chuàng)建單實例RDS,也可以創(chuàng)建高可用RDS和跨機房的master-slave RDS,對于重要的業(yè)務(wù),一般都建議至少配置有備庫。

有效的備份和恢復(fù)策略對于數(shù)據(jù)庫安全的重要性不言而喻,而海量數(shù)據(jù)庫的備份系統(tǒng)設(shè)計和實現(xiàn)卻不是那么簡單的一件事,需要考慮的細節(jié)還有很多。

希望本文對于有意研發(fā)海量DB備份系統(tǒng)的童鞋有一些幫助。沒有意向自研的童鞋,不妨考慮將數(shù)據(jù)庫遷移上云,讓強大的云數(shù)據(jù)庫為您的數(shù)據(jù)保駕護航。

文章標題:從爐石傳說數(shù)據(jù)庫故障看數(shù)據(jù)備份策略
標題來源:http://www.muchs.cn/news/105462.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、移動網(wǎng)站建設(shè)商城網(wǎng)站、企業(yè)建站網(wǎng)頁設(shè)計公司、用戶體驗

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司