1.將服務器啟動,服務器自檢時手動進入管理程序查看raid磁盤陣列情況,發(fā)現(xiàn)硬盤的狀態(tài)為Failel,手動將其中一塊離線硬盤重新設置為online狀態(tài)后嘗試重啟服務器但重啟失敗。
2.將該硬盤重新Fail掉,重復上次的操作步驟將另一塊硬盤上線,啟動服務器,服務器啟動成功。
3.檢查系統(tǒng)和服務器內(nèi)的數(shù)據(jù)庫數(shù)據(jù)運行是否正常,然后用陣列配置工具把Failed后的盤手動rebuild,待rebuild完成后服務器及raid磁盤陣列系統(tǒng)就恢復原狀了。
磁盤陣列兩塊硬盤離線數(shù)據(jù)恢復案例二:
本案例中需要進行數(shù)據(jù)恢復的服務器為某品牌的 2850型號。服務器內(nèi)有一組6塊硬盤的raid5磁盤陣列,陣列內(nèi)的硬盤為SCSI硬盤,單盤容量為300G,服務器操作系統(tǒng)為linux Redhat4;文件系統(tǒng)為ext3文件系統(tǒng)。服務器在正常使用過程中由于未知原因有兩塊硬盤離線,管理員使用了案例一中提到的方法對其中一塊硬盤進行強制上線操作。但經(jīng)過嘗試發(fā)現(xiàn)服務器的操作系統(tǒng)啟動異常,無法通過強制上線方式恢復數(shù)據(jù),于是聯(lián)系到北亞數(shù)據(jù)恢復中心進行專業(yè)服務器數(shù)據(jù)恢復操作。
數(shù)據(jù)恢復工程師對客戶服務器進行扇區(qū)級別的完整備份,在備份過程中發(fā)現(xiàn)該服務器內(nèi)的一塊并未離線的硬盤居然存在大量壞道,可能由于服務器尚未讀到硬盤的壞道部分,因此尚未離線。
備份工作完成后對raid陣列結構分析并重組raid環(huán)境驗證raid結構,通過人工的方式對被破壞的結構進行修正并存檔。最后將修正和存檔的數(shù)據(jù)嵌入一臺正常的服務器陣列上即可進行數(shù)據(jù)驗證。
在服務器數(shù)據(jù)恢復工作中我們遇到了大量的raid5磁盤陣列兩塊硬盤同時離線的故障。其實raid5陣列是支持一塊硬盤離線時的冗余保護的,一組raid5陣列在一塊硬盤離線時是不會導致服務器癱瘓的,但如果是兩塊甚至多塊硬盤處于離線狀態(tài)時服務器便處于癱瘓狀態(tài)并且無法自動上線。由于raid控制器具有一定的敏感性,多數(shù)硬盤掉線僅僅是因為電源波動、控制器bug等隨機原因導致,所以掉線盤可能沒有嚴重的物理故障。本案例就是如此。但是此時管理員進行強制上線操作風險性是很大的,一旦上線錯誤就會導致控制器對數(shù)據(jù)產(chǎn)生一些不可逆的損壞,當管理員進入操作系統(tǒng)后因為文件系統(tǒng)不一致進行修復,服務器中所有硬盤數(shù)據(jù)不一致,數(shù)據(jù)恢復難度非常大。
更多關于云服務器,域名注冊,虛擬主機的問題,請訪問西部數(shù)碼官網(wǎng):m.ps-sw.cn