MySQL數(shù)據(jù)庫意外掉線后數(shù)據(jù)該怎么恢復-創(chuàng)新互聯(lián)

MySQL數(shù)據(jù)庫意外掉線后數(shù)據(jù)該怎么恢復，很多新手對此不是很清楚，為了幫助大家解決這個難題，下面小編將為大家詳細講解，有這方面需求的人可以來學習下，希望你能有所收獲。

創(chuàng)新互聯(lián)公司長期為超過千家客戶提供的網(wǎng)站建設服務，團隊從業(yè)經(jīng)驗10年，關注不同地域、不同群體，并針對不同對象提供差異化的產(chǎn)品和服務；打造開放共贏平臺，與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為成都企業(yè)提供專業(yè)的做網(wǎng)站、網(wǎng)站制作，成都網(wǎng)站改版等技術服務。擁有10年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。

InnoDB如果發(fā)生意外宕機了，數(shù)據(jù)會丟么？

對于這個問題，稍微了解一點MySQL知識的人，都會斬釘截鐵的回答：不會！

為什么？

他們也會毫不猶豫地說：因為有重做日志（redo log），數(shù)據(jù)可以通過redo log進行恢復。

回答得很好，那么InnoDB怎樣通過redo log進行數(shù)據(jù)恢復的，具體的流程是怎樣的？

估計能說清楚這個問題的人所剩不多了，更深入一點：除了redo log，InnoDB在恢復過程中，還需要其他信息么？比如是否需要binlog參與？undo日志在恢復過程中又會起到什么作用？

到這里，可能很多人會變得疑惑起來：數(shù)據(jù)恢復跟undo有半毛錢的關系？

其實，InnoDB的數(shù)據(jù)恢復是一個很復雜的過程，這個恢復過程需要redo log、binlog、undo log等參與。這里把InnoDB的恢復過程主要劃分為兩個階段:

第一階段主要依賴于redo log的恢復；

而第二階段，恰恰需要binlog和undo log的共同參與。

接下來，我們來具體了解下整個恢復的過程：

一、依賴redo log進行恢復

第一階段，數(shù)據(jù)庫啟動后，InnoDB會通過redo log找到最近一次checkpoint的位置，然后根據(jù)checkpoint相對應的LSN開始，獲取需要重做的日志，接著解析獲取的日志并且保存到一個哈希表中，最后通過遍歷哈希表中的redo log信息，讀取相關頁進行恢復。

InnoDB的checkpoint信息保存在日志文件中，即ib_logfile0的開始2048個字節(jié)中，checkpoint有兩個，交替更新，checkpoint與日志文件的關系如下圖：

MySQL數(shù)據(jù)庫意外掉線后數(shù)據(jù)該怎么恢復

（checkpoint位置）

checkpoint信息分別保存在ib_logfile0的512字節(jié)和1536字節(jié)處，每個checkpoint默認大小為512字節(jié)，InnoDB的checkpoint主要由3部分信息組成：

checkpoint no：主要保存的是checkpoint號，因為InnoDB有兩個checkpoint，通過checkpoint號來判斷哪個checkpoint更新。

checkpoint lsn：主要記錄了產(chǎn)生該checkpoint是flush的LSN，確保在該LSN前面的數(shù)據(jù)頁都已經(jīng)落盤，不再需要通過redo log進行恢復。

checkpoint offset：主要記錄了該checkpoint產(chǎn)生時，redo log在ib_logfile中的偏移量，通過該offset位置就可以找到需要恢復的redo log開始位置。

通過以上checkpoint的信息，我們可以簡單得到需要恢復的redo log的位置，然后通過順序掃描該redo log來讀取數(shù)據(jù)，比如我們通過checkpoint定位到開始恢復的redo log位置在ib_logfile1中的某個位置，那么整個redo log掃描的過程可能是這樣的：

MySQL數(shù)據(jù)庫意外掉線后數(shù)據(jù)該怎么恢復

（redo log掃描過程）

Step 1：從ib_logfile1的指定位置開始讀取redo log，每次讀取4 * page_size的大小，這里我們默認頁面大小為16K，所以每次讀取64K的redo log到緩存中，redo log每條記錄（block）的大小為512字節(jié)。

Step 2：讀取到緩存中的redo log通過解析、驗證等一系列過程后，把redo log的內容部分保存到用于恢復的緩存recv_sys->buf，保存到恢復緩存中的每條信息主要包含兩部分：（space，offset）組成的位置信息和具體redo log的內容，我們稱之為body。

Step 3：同時保存在恢復緩存中的redo信息會根據(jù)（space，offset）計算一個哈希值后保存到一個哈希表（recv_sys->addr_hash）中，相同哈希值、不同（space，offset）用鏈表存儲，相同的（space，offset）用列表保存，可能部分事務比較大，redo信息一個block不能保存，所以，每個body中可以用鏈表鏈接多body的值。

redo log被保存到哈希表中之后，InnoDB就可以開始進行數(shù)據(jù)恢復，只需要輪詢哈希表中的每個節(jié)點獲取redo信息，根據(jù)（space，offset）讀取指定頁面后進行日志覆蓋。

在上面整個過程中，InnoDB為了保證恢復的速度，做了幾點優(yōu)化：

優(yōu)化1：

在根據(jù)（space，offset）讀取數(shù)據(jù)頁信息到buffer pool的時候，InnoDB不是只讀取一張頁面，而是讀取相鄰的32張頁面到buffer pool。這里有個假設，InnoDB認為，如果一張頁面被修改了，那么其周圍的一些頁面很有可能也被修改了，所以一次性連續(xù)讀入32張頁面可以避免后續(xù)再重新讀取。

優(yōu)化2：

在MySQL5.7版本以前，InnoDB恢復時需要依賴數(shù)據(jù)字典，因為InnoDB根本不知道某個具體的space對應的ibd文件是哪個，這些信息都是數(shù)據(jù)字典維護的。而且在恢復前，需要把所有的表空間全部打開，如果庫中有數(shù)以萬計的表，把所有表打開一遍，整個過程就會很慢。那么MySQL5.7在這上面做了哪些改進呢？

其實很簡單，針對上面的問題，InnoDB在redo log中增加了兩種redo log的類型來解決。

MLOG_FILE_NAME

用于記錄在checkpoint之后，所有被修改過的信息（space，filepath）；

MLOG_CHECKPOINT

則用于標志MLOG_FILE_NAME的結束。

上面兩種redo log類型的添加，完美解決了前面遺留的問題，redo log中保存了后續(xù)需要恢復的space和filepath對。所以，在恢復的時候，只需要從checkpoint的位置一直往后掃描到MLOG_CHECKPOINT的位置，這樣就能獲取到需要恢復的space和filepath。在恢復過程中，只需要打開這些ibd文件即可。當然由于space和filepath的對應關系通過redo存了下來，恢復的時候也不再依賴數(shù)據(jù)字典。

這里需要強調的是MLOG_CHECKPOINT在每個checkpoint點中最多存在一次，如果出現(xiàn)多次MLOG_CHECKPOINT類型的日志，則說明redo已經(jīng)損壞，InnoDB會報錯。

最多存在一次，那么會不會有不存在的情況？

答案是肯定的，在每次checkpoint過后，如果沒有發(fā)生數(shù)據(jù)更新，那么MLOG_CHECKPOINT就不會被記錄。所以只要查找下redo log最新一個checkpoint后的MLOG_CHECKPOINT是否存在，就能判定上次MySQL是否正常關機。

5.7版本的MySQL在InnoDB進行恢復的時候，也正是這樣做的，MySQL5.7在進行恢復的時候，一般情況下需要進行最多3次的redo log掃描：

1、首先對redo log的掃描，主要是為了查找MLOG_CHECKPOINT，這里并不進行redo log的解析。如果你沒有找到MLOG_CHECKPOINT，則說明InnoDB不需要進行recovery，后面的兩次掃描可以省略；如果找到了MLOG_CHECKPOINT，則獲取MLOG_FILE_NAME到指定列表，后續(xù)只需打開該鏈表中的表空間即可。

2、下一步的掃描是在第一次找到MLOG_CHECKPOINT基礎之上進行的，該次掃描會把redo log解析到哈希表中，如果掃描完整個文件，哈希表還沒有被填滿，則不需要第三次掃描，直接進行recovery就結束。

3、最后是在第二次基礎上進行的，第二次掃描把哈希表填滿后，還有redo log剩余，則需要循環(huán)進行掃描，哈希表滿后立即進行recovery，直到所有的redo log被apply完為止。

redo log全部被解析并且apply完成，整個InnoDB recovery的第一階段也就結束了，在該階段中，所有已經(jīng)被記錄到redo log但是沒有完成數(shù)據(jù)刷盤的記錄都被重新落盤。

然而，InnoDB單靠redo log的恢復是不夠的，這樣還是有可能會丟失數(shù)據(jù)(或者說造成主從數(shù)據(jù)不一致)。

因為在事務提交過程中，寫binlog和寫redo log提交是兩個過程，寫binlog在前而redo提交在后，如果MySQL寫完binlog后，在redo提交之前發(fā)生了宕機，這樣就會出現(xiàn)問題：binlog中已經(jīng)包含了該條記錄，而redo沒有持久化。binlog已經(jīng)落盤就意味著slave上可以apply該條數(shù)據(jù)，redo沒有持久化則代表了master上該條數(shù)據(jù)并沒有落盤，也不能通過redo進行恢復。

這樣就造成了主從數(shù)據(jù)的不一致，換句話說主上丟失了部分數(shù)據(jù)，那么MySQL又是如何保證在這樣的情況下，數(shù)據(jù)還是一致的？這就需要進行第二階段恢復。

二、binlog和undo log共同參與

前面提到，在第二階段恢復中，需要用到binlog和undo log，下面我們就來看下具體的恢復邏輯是怎樣的？

其實該階段的恢復中，也被劃分成兩部分：第一部分，根據(jù)binlog獲取所有可能沒有提交事務的xid列表；第二部分，根據(jù)undo中的信息構造所有未提交事務鏈表，最后通過上面兩部分協(xié)調判斷事務是否可以提交。

MySQL數(shù)據(jù)庫意外掉線后數(shù)據(jù)該怎么恢復

（根據(jù)binlog獲取xid列表）

如上圖所示，MySQL在第二階段恢復的時候，先會去讀取最后一個binlog文件的所有event信息，然后把xid保存到一個列表中，然后進行第二部分的恢復，如下：

MySQL數(shù)據(jù)庫意外掉線后數(shù)據(jù)該怎么恢復

（基于undo構造事務鏈表）

我們知道，InnoDB當前版本有128個回滾段，每個回滾段中保存了undo log的位置指針，通過掃描undo日志，我們可以構造出還未被提交的事務鏈表（存在于insert_undo_list和update_undo_lsit中的事務都是未被提交的），所以通過起始頁（0，5）下的solt信息可以定位到回滾段，然后根據(jù)回滾段下的undo的slot定位到undo頁，把所有的undo信息構建一個undo_list，然后通過undo_list再創(chuàng)建未提交事務鏈表trx_sys->trx_list。

基于上面兩步，我們已經(jīng)構建了xid列表和未提交事務列表，那么在這些未提交事務列表中的事務，哪些需要被提交？哪些又該回滾？

判斷條件很簡單：凡是xid在通過binlog構建的xid列表中存在的事務，都需要被提交。換句話說，所有已經(jīng)記錄binlog的事務，需要被提交，而剩下那些沒有記錄binlog的事務，則需要被回滾

三、回顧優(yōu)化

通過上述兩個階段的數(shù)據(jù)恢復，InnoDB才最終完成整個recovery過程，回過頭來我們再想想，在上述兩個階段中，是否還有優(yōu)化空間？比如第一階段，在構造完哈希表后，事務的恢復是否可以并發(fā)進行？理論上每個hash node是根據(jù)（space，offset）生成的，不同的hash node之間不存在沖突，可以并行進行恢復。

或者在根據(jù)哈希表進行數(shù)據(jù)頁讀取時，每次讀取連續(xù)32張頁面，這里讀取的32張頁面，可能有部分是不需要的，也同時被讀入到Buffer Pool中了，是否可以在構建一顆紅黑樹，根據(jù)（space，offset）組合鍵進行插入，這樣如果需要恢復的時候，可以根據(jù)紅黑樹的排序原理，把所有頁面的讀取順序化，并不需要讀取額外的頁面。

看完上述內容是否對您有幫助呢？如果還想對相關知識有進一步的了解或閱讀更多相關文章，請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道，感謝您對創(chuàng)新互聯(lián)的支持。

另外有需要云服務器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn，海內外云服務器15元起步，三天無理由+7*72小時售后在線，公司持有idc許可證，提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案，具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢，專為企業(yè)上云打造定制，能夠滿足用戶豐富、多元化的應用場景需求。

本文名稱：MySQL數(shù)據(jù)庫意外掉線后數(shù)據(jù)該怎么恢復-創(chuàng)新互聯(lián)
標題鏈接：http://muchs.cn/article2/cecjoc.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站內鏈、虛擬主機、建站公司、網(wǎng)站排名、全網(wǎng)營銷推廣、做網(wǎng)站

聲明：本網(wǎng)站發(fā)布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經(jīng)允許不得轉載，或轉載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內容