win7iis部署asp.net網(wǎng)站媒體營銷平臺
服務(wù)器數(shù)據(jù)恢復環(huán)境:
兩組分別由4塊SAS接口硬盤組建的raid5陣列,兩組raid5陣列劃分LUN并由LVM管理,格式化為EXT3文件系統(tǒng)。
服務(wù)器故障:
RAID5陣列中一塊硬盤未知原因離線,熱備盤自動激活上線替換離線硬盤。在熱備盤上線過程中,raid5陣列中又有一塊硬盤離線。熱備盤同步失敗,該raid陣列崩潰,LVM結(jié)構(gòu)變得不完整,文件系統(tǒng)無法正常使用。
將故障RAID5陣列中的兩塊離線硬盤標記后取出進行檢測,發(fā)現(xiàn)先離線硬盤無法識別,初步推斷該盤存在硬件故障,需要開盤修復,另一塊硬盤可以正常識別。
?? ?
服務(wù)器數(shù)據(jù)恢復過程:
1、將故障raid中其他沒有離線的硬盤標記后取出。硬件工程師對這些硬盤進行檢測后沒有發(fā)現(xiàn)有硬盤存在明顯硬件故障,都可以正常讀取。以只讀方式將完好的硬盤進行扇區(qū)級全盤鏡像。鏡像完成后將所有磁盤按照原樣還原到原服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。硬件工程師在無塵工作間對故障硬盤進行開盤修復操作。開盤后發(fā)現(xiàn)該硬盤盤片磨損嚴重,無法修復,只能對陣列進行缺盤處理。
為了安全起見,對另一組raid陣列的全部成員盤進行只讀全盤鏡像。
2、基于鏡像文件分析硬盤底層數(shù)據(jù)。解析EXT3文件系統(tǒng)結(jié)構(gòu),分析兩組raid5陣列的盤序、條帶大小、校驗方向等配置信息。根據(jù)上述分析出來的信息重組兩組raid5陣列。由于有一塊硬盤無法修復,所以在重組故障raid時只能做缺盤處理。
3、兩組raid5陣列重組完成后分析底層數(shù)據(jù),找到LVM結(jié)構(gòu)信息并分析LVM結(jié)構(gòu)。將兩組raid中作為PV(LVM物理卷)的LUN導出,然后將兩個PV重組,重新生成LVM邏輯卷。
4、LVM重組完成之后,使用北亞企安自主開發(fā)的工具解析LV(邏輯卷)中的EXT3文件系統(tǒng),恢復并導出其中的全部數(shù)據(jù)。
5、在恢復出來的數(shù)據(jù)中挑選部分壓縮文件進行校驗,發(fā)現(xiàn)部分文件損壞。對比解析結(jié)果和恢復結(jié)果,發(fā)現(xiàn)部分文件損壞且無法恢復。經(jīng)過分析,初步判斷文件損壞與兩組raid中部分硬盤存在壞道有關(guān)。
兩組raid中部分硬盤壞道情況:
Raid 1:2# ? 67 bad source sectors encountered.
? ? ? ? ? ? ? 4# ? 13 bad source sectors encountered.
Raid 2:2# ? 37 bad source sectors encountered.
6、由于故障硬盤損壞嚴重,無法修復,且部分硬盤存在壞道,導致raid結(jié)構(gòu)存在缺陷,部分文件損壞。經(jīng)過用戶方驗證,大部份文件恢復出來了,只有小部分文件丟失或者損壞,用戶方認可數(shù)據(jù)恢復結(jié)果。