探索中国CIO人才现状 | 第四季调研报告
存储平台实施秘籍
2014-03-14  作者:e--works 

  在决定是否在企业的环境中实施对象存储平台时,首先概要的指出存储的数据类型以及通常如何使用。可以从回答下面的问题开始:


  ·是时候开发真正的内容存储?换句话说,我是否需要大量法规遵从的在线数据或者是否具有历史价值?


  ·我是否要处理大量淹没了我的文件共享的数据?这个数据是否在创建后短期内不活跃,但是仍旧呆在主存储中很长时间了?我需要时,是否需要高速访问或者更慢的访问也OK?


  ·现在我是否用备份进行归档?是否导致备份窗口问题?我的大多数应用灾难恢复(DR)保护是地理分离的?如果不是,我是否还需要他们?我是否有大量的数据生来就是静态的,比如照片或者视频,是否需要保持在线延长期?我的公司是否期望现在或者未来在这些数据上进行严肃的分析?


  如果大部分的问题回答都是“Yes”,随后就需要认真考虑对象存储了。考虑到对象存储的特性,很容易看出为什么这种用例或称为DR目的和Web2.0应用的热门选择,涵盖了内容存储、长期归档、后端备份一个用、地理分离的备份。Web2.0应用一开始就针对对象存储编写具有明显优势。但是后来大多数都是被类似Facebook、Twitter、Google、eBay这样的企业编写,他们都为了自己的使用,开发了自己的对象存储架构,对外部世界是不可用的。然而幸运的是,现在很多厂商精通于企业级对象存储。


  对象存储平台选择:类型,提供的厂商


  基本上有四个选择:


  1.从当下各种厂商处购买完整功能的对象存储平台。


  2.购买对象存储软件并将其安装在你选择硬件上(服务器和存储)。


  3.在选择的文件和块存储整列中安装软件,这个阵列对现有存储增加了对象接口。


  4.使用网关解决方案连接现有应用到公有云。


  完整功能的对象存储可以从EMC(基于Atmos-based)、Cleversafe、Compuverde、DDN、Dell(基于Caringo的DX)、HPStoreAll、NetAppStorageGrid、QuantumLattus(AmplidataOEM)、Scality、Tarmin等处获得。对象存储软件(或虚拟机版本)也可以从大多数厂商处获得。开源软件(OpenStackSwift、Ceph、Gluster)可以免费下载。同时也有商业的全支持的开源软件可用,比如Inktank(Ceph)和RedHatStorage。


  以上三个选择中的软件大多数可以从主要的厂商处获取,比如EMCIsilon或ViPR、HDS和HP3PAR。第四类的兴趣点在备份软件和归档平台厂商,他们修改了其软件,使其后端成为一个公有云,比如亚马逊Web服务或者微软Azure。在这种情况下,本质上可以从对象存储获得优势,而且无需自己构建系统。这可能是进入这个游戏最佳的方式,你可以了解更多的对象存储功能和限制。


  大量的小型备份和DR厂商,由于过多就不一一列举了,过去三年中在这个领域不断发展,使用公有云作为其存储库。主要提供商中,Riverbed提供了Whitewater设备,为立即存储提供本地重复删除备份数据,而且使用后端公有云存储更旧的备份,是DR进入云端或者在一个第三方网站上。


  Symantec也提供一种可以存储在公有云中的备份方式。微软通过对于StorSimple的收购,在其数据中心有一个设备,对应用显示一个iSCSI接口,同时优化数据,包括执行针对微软Azure的所有协议转换。这种场景中没有任何必须要做的应用改变。


  如果你选择了第一种或者第二种,这项工作就会变得很重要。你需要确定哪一个应用要运行在对象存储上,以及这些应用如何修复,以便让基于REST的调用到达对象存储。如果你对于改变这些应用的源码没有控制,你的选择就仅限于使用网关。然而,如果你能够修复这些应用,就可以继续,然后调研市场上的对象存储产品,看看哪一款符合你的需求。


  但是我的建议是在着手构建大型私有云之前,可以在公有云上练手。备份应用本身也易于实现这种操作。可能就是要从这里开始。在这个过程中,你最终会得到“免费”的离线的DR。然后考虑大型内容存储,可能最初使用网关,以便不对应多做任何改变。但你开始修复应用时,你就能够使用元数据,这也是对象存储需要的,就可以开始进行各种以前从没想过的分析。


  当然,如果你自己开发了Web2.0应用,你就要从一开始正确实施成熟的对象存储了。


  对象存储不再被忽视


  如果你以前没有准备好,现在是时候严肃认真对待对象存储了。尤其是你选择了什么,以及如何实施。我建议你可以让用例来确定最佳的方法,并且从小地方开始。如果可以,在开始大的战略决策前,了解对象存储的特性。


  另一个替代选择是研究一下统一产品,大多数来自于更大的厂商,你可以得到全部的三种访问方式(文件、块和对象),而且不用担心构建独立的对象存储。但是要记住,这样的统一系统最终拥有文件和对象,而且根据执行、成本和扩展性实现。但是便捷性是无敌的。