磁盤陣列服務器的數據恢複技術
目前服務器使用較多的就是RAID數據存儲技術,它在存儲容量、存儲安全和存儲速度上都有一定的優勢。但是RAID磁盤陣列一旦出現故障,給用戶帶來的損失也往往至爲慘重。
對於服務器來說至常見的就是磁盤物理故障和RAID卡故障。一旦發現RAID陣列出現故障,不要輕易嘗試Rebuild、同步等操作,更不要初始化硬盤。通過正確的操作是可以幫助妳把損失降到至低的。運氣好還可以讓服務器“起死回生”。盡管各個廠傢RAID卡的操作界麵不一樣,但是恢複原理基本是一樣的。下麵是針對HP LH3服務器RAID損壞後的一次數據恢複經曆,希望能對大傢有所幫助。
如在實驗中採用的HP LH3服務器,磁盤陣列爲RAID-5。出問題時錶現爲係統死機,鼠標、鍵盤均無響應,沒有任何錯誤提示,以爲是正常的死機,Reset重新啓動,服務器自檢的時候提示“Logic disk failed”,硬盤都沒有發現,看來是RAID出問題。於是就決定查看RAID配置是否正常,重新啓動當係統自檢到RAID卡時,按照提示按CTRL+M進入HP NETRAID Express Tool界麵,不同品牌的服務器RAID卡不一樣,進入的方式也不一樣,,需要自己註意。下圖是進入HP NETRAID Express Tool界麵的提示:
按照HP LH3服務器的提示,按CTRL+M進入HP NETRAID Express Tool界麵,然後選擇“Objects”---->“Physical Drive”如下圖:
回車確認,如下圖,可以發現兩塊硬盤FAIL,RAID-5兩塊硬盤同時都FAIL的可能性微乎其微。這其中至主要的功能
RAID5兩塊硬盤同時損壞的情況是不常見的,因爲RAID卡通常都有自保護動作的。比如RAID-5陣列,當陣列卡發現有一塊硬盤出現問題的時候,會自動 Degrade(降低RAID級别),係統自檢的時候也會出現Degrade提示,這樣可以降低風險。當出現RAID中的一塊硬盤fail的時候切記不要盲目操作,因爲RAID信息是同時保存在RAID卡和硬盤中的,而RAID損壞就是由於RAID卡或者硬盤故障,導緻RAID信息不匹配。所以恢複RAID這個操作,實際上就是讓RAID卡中的RAID信息和硬盤中的RAID信息同步的過程。針對RAID-5陣列兩個硬盤都損壞的情況,一定不能讓兩塊硬盤同時ONLIN,應該每次隻選擇其中的一塊硬盤做ONLIN。這樣可以避免不同步的RAID信息被損壞的信息交叉複蓋。如果僅僅一塊硬盤FAIL,就讓這塊硬盤ONLIN。
首先將ID3硬盤ONLIN,光標選擇ID3硬盤,然後回車,選擇菜單中的“Make onweb”,如下圖:
保存設置後褪出“HP NETRAID Express Tool界麵”,重新啓動計算機,檢查是否可以啓動係統,如果啓動過程沒有變化,則按照上麵的方法使另外一塊硬盤ONLIN。兩塊硬盤分别onweb都無法啓動係統,到係統自檢的時候提示“win2000 係統文件損壞”,這個提示說明RAID已經正常,僅僅是win2000係統啓動文件損壞。盡管係統沒有啓動,但還是有辦法把數據庫數據備份出來。可以借助一個光盤引導係統來讀取服務器硬盤上的數據,這種方法在係統崩潰無法啓動時很有用。在這裏推薦Winternals公司的光盤工具ERD commander,目前至新版本爲ERD commander 2003。ERD commander的功能非常強大。當係統損壞無法啓動的時候,利用ERD commander可以直接從光盤引導進入一個類似於windows操作界麵的係統,通過這個光盤引導起來的ERD commander係統可以沒有限製的訪問硬盤上的數據,還能夠通過USB設備、網絡移動數據,甚至可以修改係統的管理員密碼,修複係統錯誤。詳細的信息可以訪問http://www.winternals.com/獲取,也可以通過該網址分享一個ERD Commander試用版。ERD Commander 2003引導起來的係統如下圖,和windows的操作界麵非常相似。利用其中的“資源管理器”很容易把SQL數據備份出來。關於SQL數據的備份與恢複,以前《網管員世界》上有不少相關的介紹,在這裏就不細說,至簡單的就是把SQL安裝目錄下的date文件夾都copy出來,然後在新數據庫下用替換法來處理。
利用ERD Commander光盤引導服務器啓動時需要註意提示:按F6加載SCSI或者RAID卡的驅動,否則ERD Commander是無法發現係統硬盤的。ERD Commander是可以識别USB硬盤的,而且支持USB2.0。
SQL數據是備份後,如果想知道到底是硬盤或者是RAID卡損壞,還需要進一步診斷。如果是RAID卡壞通常是無法再識别RAID的。所以通常是硬盤壞的幾率要大。判斷服務器具體哪一塊硬盤出問題,需要把硬盤接到SCSI方式,因爲在RAID機製下所有硬盤是一個整體,妳是無法區分具體硬盤的。不同的服務器切換硬盤連接方式是不同的,有的需要打開機箱把硬盤的SCSI數據線從RAID卡上換到SCSI上,有的則僅僅需要在BIOS設置上更改一下就可以。HP LH3就僅僅需要在BIOS中更改就可以,按F2進入HP LH3服務器的BIOS設置,如下圖,隻要將“Intergraded HP NetRAID”項“Enabled”改爲“Disabled”就會將硬盤的連接方式從RAID卡方式改爲SCSI卡方式。www.hszhuifu.com
在SCSI方式下,使用硬盤校驗工具就可以判斷硬盤是否存在問題。HP LH3服務器在SCSI的工具中提供一個硬盤校驗工具。啓動服務器按Ctrl+C進入SCSI配置工具,選擇要校驗的硬盤,選擇“Verify”就開始校驗硬盤。如下圖:
總之,通過這一係列完整的操作過程,RAID故障得到有效處理。採用正確的操作方法,正確的工具,穩妥的操作,是對RAID磁盤陣列進行數據恢複的關鍵所在。