当RAID还原需要的技巧超出内部已掌握的时候,RAID还原服务提供商可能就是解决之道,只要选择合适的一家即可。
由于软件缺陷、驱动器级别的机械故障或者在记录期间发生的误码,可能无处不在的传统的RAID容易出现故障。操作RAID存储的任何人都会有阵列需要数据恢复操作(通常由RAID恢复服务执行)的问题,这种情况几率很高。
RAID协议背后的概念很简单:使用最早的五个方案中的一个,在阵列的一个或者多个磁盘中制作数据(或者需要重建数据的数据)的副本,数据通过冗余实现可恢复。
RAID专门为从某些互不相关的故障实例进行恢复而设计的,前提是操作员注意到该故障并且迅速对其进行响应。有些RAID阵列会以降低的级别运作,直至故障磁盘被可工作的磁盘替换。随着替换的完成,操作员可以手动开始重建过程,把新的磁盘集成到阵列,或者在某些情况下,系统将自动启动重建。
大多数情况下的主要挑战在于及时解决磁盘故障;这意味着在同一个RAID组中的第二个或者第三个驱动器发生故障之前。
大多数情况下的主要挑战在于及时处理磁盘故障;这意味着在同一个RAID集里的第二个或者第三个驱动器发生故障之前,这种情况经常出现,超出你的想象。这是因为按序生产的RAID驱动器通常同时被部署到同一个RAID集。如果一个驱动器脱机,有些阵列的技术可以重建RAID组,而其它专有的方法(并非原先的加利福尼亚大学伯克利分校的RAID协议)可以承受两个驱动器的故障。
但是,数据存储管理人员可以指望与大多数RAID技术的手动或者自动恢复机制相关的缓慢的重建时间。恢复装载300 GB驱动器的RAID集可能会比恢复使用几个TB的驱动器的相同的RAID组耗时要短,因为大量的数据必须被处理,以复制恢复数据或者把记录的数据发送到新的驱动器。
尽管如此,许多公司缺乏现场的知识和技巧来完成具有挑战性的RAID还原。由于害怕犯下危及RAID集的所有数据(包括并未受到磁盘故障或者其他错误事件影响的数据)的小错误,有些IT规划者宁愿外包给RAID恢复服务。市场上有很多可用于完成这项工作的服务,但是选择合适的服务确实需要一点体力活儿。
找到最好的RAID恢复服务的四点技巧
从技术的角度来看,RAID恢复服务提供商不仅需要具备包括原先的5种(或者6种,如果包括RAID 0或者无RAID保护)基本的RAID阵列级别或者技术的能力,而且需要具备RAID 5E、RAID 5EE、RAID 6、RAID 10、RAID 50、RAID 51、RAID 60以及RAID ADG等其它级别的能力。这些RAID级别可以利用多个连接和磁盘驱动器的类型以及各种各样的以太网连接。技术挑战之外就是由服务器和存储系统厂商以及有些介质制造商带来的RAID技术的变化。
1、找一家支持您的硬件的RAID恢复服务。底线是你需要详述受损的RAID集的特性:部件的型号和生产商、RAID软件的固件版本、驱动器的大小和型号、连接的类型、使用的操作系统、甚至把数据写入存储的可能的业务应用程序。然后你需要找一家对你现有的配置有经验的服务提供商。
2、了解RAID故障的原因。不要接受厂商有时会做出的有关“RAID故障的四个基本原因”的简单的保证。尽管由于硬件RAID故障、软件RAID故障、人为错误以及应用程序错误,的确出现RAID系统中断,但是对根本原因的分类的了解并不代表把数据从受损的RAID集进行恢复的能力。
3、寻求认证的RAID恢复服务提供商。如果服务提供商具备恢复服务的基本实践方面的认证,例如国际标准ISO 4级、美国联邦标准10级的洁净室认证(Cleanroom Certification)(管控执行工作的设施中悬浮粒子污染等级,如果工作是在服务提供商的公司执行)、遵从敏感数据资产安全处理的SSAE 16 Type II审计准则以及可能适用你的数据的性质以及法律/监管规定的数据保存和保护要求的其它认证,这通常是一个好兆头。你也应该从硬件厂商寻求你的RAID系统基于的设备或者软件的认证。
4、条款清晰的合同是关键。寻找详述提供服务的内容以及预期结果的时间跨度的简洁易懂的合同。您可能喜欢在开始时有一个诊断的步骤,以查明你的数据是否完全可恢复。这最好是一项免费的服务,因为实际的恢复可能价格高昂,尤其对于SAN或者对于某些把内容寻址(content-addressable)存储算法与RAID进行组合的系统。