探索中国CIO人才现状 | 第四季调研报告
云备份:如何摆脱对厂商的依赖?
2013-07-24  作者:存储在线 

  现在是评估、测试和关注备份的时候了。目前令人纠结的问题是对云进行评测,以判断我们自己是否需要去担忧云备份。如果真是那样的话,我们又该如何做呢?


  我对云服务的现状了解得越深,我对我所发现的现象就越担忧。每一家厂商都有完全不同于其他厂商的备份政策,有些厂商甚至没有备份政策。


  服务型基础设施(IaaS)厂商在这方面做得似乎是最差的。我们经常认为公共云上的虚拟机和存储服务是所向无敌的。


  当巨人陨落之时


  这与事实相差甚远。即使是最强大的亚马逊也曾在一年前丢失过客户的数据。


  试想一下,连亚马逊也丢失过客户数据啊。我们说的可不是古老的Co-Lo和数据托管服务。这可是一家刚刚从IBM手中抢走了中情局数据中心合同订单的公司。


  虽然亚马逊也不能保证客户数据百分之百不丢失,但它可是云技术领域中的精英。


  你可以将你的数据交给亚马逊云平台的多个区域托管,但是如果你的运气不好的话,仍有可能遇到多个区域的服务同时宕机的事故。


  你也许能够找到一家公共云厂商为你提供足够多的备份副本,而且那些备份分布在很多存储层级上以保证你的数据万无一失,但这只是针对工作区的保障措施,而不是真正的备份。


  工作区技术比如高效率、容错等等可以在基础设施出现故障时对数据进行保护。它们并不能防止数据输入时出现巨大错误或意外删除。


  我们只是人


  在现实世界里,仅仅避免基础设施故障是不够的。你不可避免地会在很多时候遇到一些情况,必须提取和使用以前某个时间点的数据备份。


  你将永远也不能用技术取代人在数据收集过程中所发挥的作用。如果不是McFumblefingers将信息压缩成一种形式并提交,那就是能与API通讯的脚本或从常用文件夹读取输入文件。随着API的不断发展,输出格式也变得各不相同了。


  在某些情况下,修改是为了解决安全方面的问题。在其他情况下,它可能只是一个政客修改夏时制以节约时间或某些国家宣布独立。总是有些东西需要更新。更新最终是要由人来完成的,因此犯错将是难免的。


  这意味着需要对版本进行控制,也就是对增量备份进行控制。如果你是在自己的基础设施上运行自己的云,那么备份将是非常容易的一件事。VSphere可以拍下正在运行的虚拟机的快照,Unitrends或类似的服务可以将一切都备份下来。


  你甚至可以利用Asigra等软件将数据或数据副本备份到公共云上。我选择Asigra是因为它似乎可以提供几种不同类型的云备份。


  我不想将我的数据保存在美国。Asigra可以满足我这方面的要求,作为一家受控服务供应商,我可以将客户的数据备份在我这里。


  加倍或是退出


  这种分层备份的方法很重要。如果你的数据不是被保存在两个不同的地方,它就有可能在有朝一日不复存在。正如将数据保存在亚马逊云服务的两个不同区域中不够保险一样,在我的数据中心里安装一台Unitrends设备并利用它来进行单一备份也是不够保险的。


  如果发生一场火灾,一次水灾或大楼一侧被卡车撞击都可能令工作区的数据和保存在本地设备上的数据备份丢失掉。


  照这样来看,唯一可行的做法就是将数据备份到本地设备然后将那些备份映射到另一个地方,比如你所拥有的某个地方、一家受控服务供应商或是一家公共云供应商。


  鉴于工作负载是运行在你自己的基础设施之上,这是很好理解的,但是你如何去备份公共云中的数据呢?


  避免这种无聊之举难道不正是公共云最大的卖点之一吗?


  事实是大多数网络供应商在对不同版本的备份数据进行分类时做得实在太差。Salesforce就是个很好的例子。


  Salesforce使用的是磁带备份,它可以保证你的数据平均每天都进行一次备份。除了恢复数据的价格之外,这种解决方案听起来还是比较合理的。从Salesforce的备份中恢复数据的最低费用为1万美元。


  当我看到Salesforce的备份服务要价如此之高时,我感到大吃一惊,脑袋完全转不过弯了。Salesforce的吸引力立刻大打折扣了。


  Salesforce针对这个问题推荐的解决方案是从一家合伙公司那里购买服务型备份(BaaS)服务,事实上,业内其他的服务商为你提供的建议也是大同小异的。因此,要想使用服务型软件(SaaS)应用,你还需要再花一些钱来备份它。


  需要说明的是,那些成本可能会以不同的形式体现出来,具体将取决于你试图备份的设备或服务。


  备份服务一般是按照带宽和数据量进行收费,如果需要恢复数据则需另外付费。对非常善于计算的人解释这种定价模式并不是一件容易的事,一张幻灯片肯定是不够的。


  选择Salesforce很容易,但是这几乎是一个普遍性问题。我并不能访问不同版本的Gmail或Office365邮件。如果想要访问不同版本的电子邮件,就必须使用LiveOffice(现在为赛门铁克所有)或类似的应用。(在从美国云服务迁移出来之前,我使用的是SpanningwithGmail。)


  当你要理发时,你不必购买第三方保洁服务来扫地


  这种模式是危险的。IT专业人员看着任何网络时都想将IT与单一故障点隔离开来。


  当你走进一家理发店时,你希望在理发时多交一点点钱来支付扫地的费用,那样你就不必购买第三方保洁服务来扫地了。


  技术专家们擅长的是技术,但是他们倾向于将他们核心专业知识之外的问题划到自己的职责范围之外。不管他们想要推卸的问题与安全有关还是与备份有关,这都会导致信任危机。随着时间的推移,越来越多的人丢失数据,当这类事故的数量累积到一定程度之后,用户们对公共云概念的信心就会逐渐被销蚀掉。


  数字游戏


  如果你购买了云服务,那么你就将面临这个问题。云服务的持续存在完全依赖于规模经济。如果你所依赖的服务不能满足足够多用户的需求,那么你最后可能就要面临服务被关闭的困境,就象GoogleReader一样。


  我承认,与设计得很差的其他同类技术相比,BaaS作为一种解决方案还是有一定价值的,但是还需对这种解决方案进行更深入的研究。BaaS厂商不大可能在自己的硬件上运行那项服务。很可能那些服务是运行在公共云厂商提供的虚拟数据中心里。


  如果你使用的是亚马逊的EC2服务,同时感觉需要挑选一家BaaS厂商的话,备份厂商可能会在亚马逊的EC2平台上托管其服务。我不能完全确定它的用处有多大。面对着众多的SaaS厂商,这个问题只会变得更加复杂。并非只有书呆子才会在微软的云上运行Office365或是在谷歌的云上运行GoogleApps。否则的话,Salesforce应该在哪里运行呢?凌空运行?你最喜爱的云移动设备管理供应商?


  即使你不辞辛苦地去使用S+BaaS解决方案,也不一定能够脱离苦海。公共云看起来绝不简单,使用公共云需要深思熟虑和正确规划。


  谁是所有者?


  这都不能解决厂商依赖性的问题。除了让美国云供应商不能随便限制你下载你的数据之外,这毫无用处。在美国,数据主权是一个含糊不清的概念。在某些情况下,最终用户授权协议可以将企业们解放出来,但在其他一些情况下,它实际上是没有什么作用的。


  SaaS厂商可以愉快地作出允许合作伙伴提供备份服务的决定,条件是合作伙伴只允许你将那些数据恢复到SaaS厂商的云上。你可以随心所欲地拥有多个数据副本,但是只有在允许你迁移到另一家不同的SaaS厂商的情况下,你才能访问那些副本中的数据。


  虽然据我所知还没有人尝试过这么做,但是我认为这只是时间早晚的问题。提供有限API支持的SaaS厂商与永久锁定你的数据的厂商之间有何区别呢?


  厂商们还可以尝试服务条款的方法:摄影公司曾多次尝试为它们所拍摄的照片申请版权。


  那就是我为什么不喜欢我不能控制的云服务概念的原因。我宁愿让一家厂商在任意公共云平台上提供其服务,然后将它出售给我,但是只有当我能够将那些数据下载到一个我能控制的备份应用上之后,我们才能开始讨论。


  如果我将那些备份数据保存在网络上,我必须能够让受信任的受控服务供应商来保存它们,那样才能保证我的数据在任何时候都为我自己所有。


  现在的备份厂商必须对云越来越了解,我们也是如此。使用公共云服务是非常容易的。点点这里,敲敲那里,突然之间你的公司就完全依赖于你不能掌控的某些东西上了。


  我希望这篇文章至少能够让你们考虑一下自己的备份。你确信你们的备份仍然能够使用吗?你确信它们支持你们公司的所有数据吗?


  由于本人能力有限,因此疏漏在所难免,欢迎不吝指教。不管怎么说,对待备份,再怎么小心都不过分。