2013年11月11日

揭開維修行業的神秘,故障硬盤數據恢復全過程記錄

  硬盤是存放數據的重要電腦部件,如果出了問題容易帶來嚴重的數據損失,假如當中是包含重要的數據,有人會選擇求助於數據拯救人員,不過對於他們是如何操作來恢複數據,相信很多人都不清楚。Tom's Hardware介紹了一名硬盤出現故障的用戶,他是在NAS上以四個硬盤組建RAID 5的,選擇了把硬盤託付給SRS(希捷恢復服務),由此瞭解到專業人員是如何去恢復硬盤數據的。


故障盤的寄送

  去年SRS收到18000宗恢複數據的請求,從USB閃盤到多驅動器的磁盤陣列都有。要恢複數據,用戶須在他們的網站填寫申請,說明詳細的情況。


偵聽情況

  硬盤到手後剛開始的工作當然是診斷問題,但和很多人所想的不同,技術員第一步並非用軟件去分析硬盤故障,而是把它接上電源,然後偵聽運作情況, 用戶所描述的情況也會考慮在內的。技術員可以留意到硬盤一些輕微的震動和噪音,如果這個時候硬盤的噪音非常大,他們會馬上停止操作。在這個階段他們會儘可 能讓硬盤在最短的時間裡運行並作出判斷,如果認為還是有救的話,就進入下一個階段。


完成初步檢查

  在簡單的檢查完成後,硬盤會接入一套測試系統,看看它能否完成基本的測試任務,比如能否啟動,能否得到某些數量值,還有進行讀寫操作。這個階段的重點是要確定接下來把硬盤交給SRS裡負責哪個方面的人員。


潔淨的工作台

  這是一個醫療級的HEPA淨化工作台,可以在打開硬盤時提供乾淨的空氣,除去空氣中細小的顆粒,包括細小的灰塵,而新的空氣是不斷供應的,環境非常潔淨。


如同在泡泡裡的環境

  環境是需要極為潔淨的,因為少量的灰塵顆粒都有可能對恢復工作帶來很大影響。


硬盤開蓋

  接下來就是打開硬盤的蓋子了。希捷的人員Peter Oswald說他見過有被狗咬過的,被錘子砸過的,被火燒過的,進了水的……各種各樣出問題的硬盤。


過濾器

  很多人不知道大多數的3.5英吋硬盤裡都至少有一個過濾器。過濾器是在乾淨的生產條件下裝入硬盤的,所以本來是很乾淨的。它在恢複數據的診斷過 程中扮演重要角色,技術員通過它可以很快知道磁頭有沒有和盤片表面接觸過,有接觸過的話,出現的細小碎粒會飛濺到硬盤周圍,過濾器會沾上這些碎粒並變色。 在除去這些碎粒後,硬盤就可以再使用長一點的時間。


深入查看

  正常情況下,硬盤的盤片應該光滑得像鏡子,不過看看這張圖中的硬盤,盤片最外圈的那部分已經因為和磁頭接觸而磨損了,但其實大多數的硬盤都不至 於搞得那麼糟的。當技術員發現了受損情況就需要查看破壞是否蔓延到其他盤片了,這個硬盤的情況是細粒已經覆蓋到各個盤片,需要完全拆卸以進一步確定情況 了。


像爪子一樣的工具

  要繼續拆卸不容易,輕微的震動都有可能導致磁頭造成新的破壞。希捷的人員使用一種類似爪子的特製工具令這個拆卸操作更安全和快捷。磁頭一般是停在硬盤中心一個安全的區域裡的。


完全拆卸

  少數情況下,被拆出的盤片需要裝到高度專業的機器上,它們可以深度檢查磁道,一般這個時候技術員可以把受損的零件換為好的零件,讓硬盤可以比之 前更正常地運作,然後就有機會從中提取出數據。Peter Oswald表示他的團隊可以通過軟件向硬盤傳輸精確的定位,讓它懂得要如何讀取數據,不過技術員還是要懂得觀察,知道須定位到盤片的哪個區域。


用顯微鏡觀察

  有時也會遇到很難知道哪個零件出了問題的情況。在這張圖中,技術員正通過顯微鏡檢查讀寫磁頭的情況。某些時候通過更換有問題的零件,重新裝配好 硬盤,連接到恢復系統就能把數據拯救出來。恢復的時候很多硬盤只需要操作一到兩次就能把數據全部導出,硬盤一般不會再還給用戶。SRS表示超過90%的硬 盤可以恢複數據並交付給用戶。


眾多的磁頭

  Peter Oswald說,修復硬盤的難度越來越大,看看磁頭技術發展得越來越複雜就知道。前段時間有很多商店做數據恢復的生意,不過絕大部分都是基於軟件的恢復而已。


搜尋損壞的文件

  希捷也進行大量的邏輯故障硬盤修復。有時他們遇到用戶在NAS裡誤刪了某個文件夾,技術員得從很多個硬盤的無數文件碎片中去查找,再重新整合起 來。希捷表示多數的RAID恢復請求裡都涉及到物理損壞和邏輯故障。有些時候,按照用戶所在公司的政策,出問題的硬盤是不能向外寄送的,那麼希捷也可以進 行即場的數據恢復,不過價格會比一般情況下高出很多。


專業的設備

  這張圖裡的就是文章開頭遇到故障的那個用戶的硬盤,是組建了RAID的。Peter Oswald說,他們所作的操作在很多不瞭解的人眼裡都是很平常的。這張控制卡看起來很普通,但其實是為他們特別設計的,還有控制供電的軟件也是。很多這 些部件都控制著非常小的細節部分。


特製的軟件

  在進行驅動器評估和維修時,SRS人員會運行一個「驅動器維修與解鎖工具」(Drive Repair and Unlock Tool)。很多公司的工程師都用這套軟件,它可以指示出硬盤發生了什麼問題,不過按照Peter Oswald的意思,要用好這套軟件,一半還是要靠經驗。


恢複數據是首要任務

  SRS首要的任務是從受損的驅動器中導出數據,剩下的都是其次。他們所用到的複雜而專有的讀取工具功能是一般的操作系統和驅動器指令所做不到 的。在這張圖中運行的是SRS人員編寫的軟件,可以把硬盤裡的數據全部導出,綠色的部分是正常的,從圖中可以看到他們已經對這個硬盤進行過物理維修。


深入到數據中

  這張圖則是顯示硬盤裡最底層的數據,用上了十六進制編輯器。技術員會根據恢復條件,不同的結構和數據點來操作,它不僅能看到潛在的數據,有時還能修復受損的文件。


固態硬盤和閃存盤也能恢複數據

  SRS人員還接受各種儲存設備的恢復,包括SSD固態硬盤和閃存盤。要恢復閃存盤數據需要做的第一步就是知道設備的哪個部分出了問題。圖中的技 術員正尋找在測試環境下從處理器傳到閃存組件的信號,以確認指令得到執行。技術員需要對閃存芯片和晶體管元件很熟悉,他們可以通過失敗的情況深入到故障的 底層。


熱修復

  雖然儲存媒介在不斷變遷,但磁盤和閃存的恢復過程都是類似的,鑑定出有問題的組件後就需要更換。從圖中可以看出這個部件正在更換,並進行銲接。


卸下組件

  據Peter Oswald介紹,閃存盤最常遇到的情況就是人們把它插到電腦上傳輸文件時手臂不小心撞到,此外還有被咬過,掉到水裡或洗過……正是因為它們的便攜性導致了出意外的幾率更高。這張圖中的閃存模塊正從受損的盤上卸下來。


嚴密的安保

  對於這麼重要的恢復工作來說,安保自然也是需要高度重視的。SRS所有的實驗室入口都裝有指紋鎖,只有特定人員才能進入。基於安全的理由,希捷一般是不讓媒體人員進入的,而原文作者這一次算是很幸運地得以放行。


倖存下來的數據

  恢復完成後,用戶的數據會被裝到新的存儲器裡並歸還。作者出問題的硬盤約有3TB數據,希捷把它們裝到4TB的USB 3.0外 置硬盤裡,最後的恢復成果是除了6首MP3文件以外其他的文件都失而復得了。原來受損的舊硬盤希捷會保留一個月,這是為了給用戶時間去備份恢復出來的數據 和進行確認,而且還考慮到送回的新硬盤要經過發貨這個過程,同樣可能會出現意外情況,而恢復出來的數據希捷本身也會留一個備份。


數據擦寫

  為避免資料外洩,最後希捷會對他們的備份硬盤進行擦寫操作。該操作會覆蓋到每個扇區,而不是簡單的刪除,將按照軍工級標準來執行,擦寫操作會進行三到七次以保證安全,完成後的硬盤會在希捷內部繼續使用,而用戶的原硬盤則會銷毀。


數據恢復其實價格不菲

  從打電話求助SRS到最後,作者該容量四個NAS硬盤的恢復費用範圍在3000美元到20000美元之間,這視乎故障的嚴重程度而定,對於普通 用戶來說實在是貴得厲害。希捷也有售賣其數據恢復軟件,價格99美元,購買前可試用。若不想自己動手,也可以要求遠程協助,SRS支持人員會在用戶的電腦 上安裝軟件並運行,費用199美元,如果是寄送到SRS實驗室恢複數據,起步價399美元,包含硬盤寄送和交還的運費。

  最後作者再三告訴大家,平時一定要做好備份工作。

沒有留言:

發佈留言