大约10年前,一项新的数据保护技术——“持续数据保护”(continuous data protection ,CDP)——在市场上崭露头角,促使许多人推断保护数据的“旧”方法最终将夕阳西下。当我们进入2015年的时候,数据保护的旧方法——定期备份——仍然根深蒂固屹立不倒,而CDP则鲜被提及。CDP出了什么事?我们已经用更好的东西取代它了吗?
持续保护的价值
持续数据保护承诺解决一项特定的数据保护的挑战:恢复点目标(recovery point objective,RPO)。RPO是两次保护活动之间的时间;换句话说,就是在发生故障的时候需要被重新导入的数据量或者需要回放的事务日志的数量。当然,这两个过程都需要时间,而CDP背后的想法在于它可以提供非常短的RPO,因为数据不断地被捕捉。
CDP的问题所在
CDP面临的第一项挑战在于仅仅满足RPO还远远不够的这个事实。论证CDP投资的合理性的公司也需要非常快速的恢复时间目标(RTO)。
RTO是使受保护的数据拷贝归位而且可读以便应用程序可以访问所花的时间。传统上,这意味着把数据从备份设备并通过备份网络拷贝到生产存储。将数据归位是一个非常耗时的过程,尤其是使用十年前的技术。
CDP面临的第二项挑战是需要同时向正在保护的数据提供一个时间点参照。CDP缺乏恢复几天、几周、几个月甚至几年前出现的信息的能力。在2004-2005年那个年代,快照技术仍然处于起步阶段,在CDP平台本身需要进行备份之前,只有为数不多的快照可以被保留。
同时,备份只知道CDP拷贝,而不知道原始数据集。所以,恢复必须分两个阶段进行,首先到CDP设备,然后到应用程序服务器。
另外一个问题是应用程序接口。为了捕捉高质量的数据拷贝,CDP应用程序需要与Oracle 和MS-SQL等应用程序对接以便可以进行在线备份。许多CDP产品缺乏这些接口。
即使它们确实有应用程序模块,也有另外一个问题:性能。在应用程序和数据保护处理之间出现互动的任何时候都有性能损失的可能性,这是应用程序的用户无法忍受的事情。这对CDP尤其是一个问题,因为根据定义,互动必须是持续的。
最后,有一个成本问题。虽然备份到磁盘的价格已经显著下滑,但是快照等其他技术仍然处于起步阶段,所以厂商收取高价。CDP设备通常不提供重复数据删除和压缩等技术,所以备份拷贝必须与主数据的大小相同。
CDP演变
如前所述,CDP的概念是可靠的,它只需要发展。第一步是主存储需要能够满足更多的数据保护的责任。目前大多数存储系统利用重定向快照技术,能够创建几乎无限数量的节省空间的数据拷贝。这些拷贝可以被复制到本地和远程存储系统,防止主系统故障。
这种方法的另外一个优点在于数据保持着本机的、可用的格式而且很可能在可以担当生产存储的角色的存储系统上。这可以满足非常快速的RTO。
挑战在于这种方法昂贵,因为所有的存储必须来自同一家厂商。同时,应用程序不得不经常地因为保护事件的出现而受到干扰。因此,大多数客户执行一次快照的时间不超过一个小时。虽然与传统备份相比这是一个巨大的改善,但是可能仍然无法满足最严格的RPO。
在过去的几年里出现了另外两项技术,承诺解决上述的费用问题。首先,有软件定义存储(SDS),允许备用的本地系统以及DR存储系统可以是不同厂商的硬件的混合但是仍然由同一存储软件进行管理。
SDS的挑战在于:这些产品需要存储管理员的重大投入,意味着他们需要从使用当前的存储软件以及创建快照和复制数据的方法转向另一款存储软件的方法。重新培训和重写脚本的成本应该纳入这种方式的考虑因素。
另外一个选择是使用承诺解决成本和可能解决应用程序接口问题的复制数据管理产品。这些产品允许使用现有的存储软件工具来创建快照和复制数据,但是它们增加一个软件层,使那些快照更易于管理和搜索。在某些情况下,他们在应用程序层也提供更好的接口,允许更频繁的快照而不致造成应用程序性能方面的风险。
在上述两种情况下,仍然都还有长期(数据)保持的问题。两种方法都已经解决了创建成千上万的快照的问题,但提供允许从快照库内快速检索数据的管理能力的不多。IT规划人员应该留意能够在快照库内发现数据的产品。
最后一个问题是成本。虽然许多这些系统非常具有成本竞争力,而且可以利用数据效率技术,但是永久保存数据(哪怕是一个快照)的成本确实消耗存储容量。我们建议在这个处理之外在磁盘或者磁带上创建一个备份离线拷贝,以便较旧的快照可以被释放出来。
结论
CDP不死,只是演变。主存储提供了许多CDP的功能,但是这些功能被直接集成在存储系统中。复制数据提供了一个提供CDP的外部方法,承诺用更好的管理并且使用受保护的数据集来提升CDP的功能。