探索中国CIO人才现状 | 第四季调研报告
云存储自动分层系统的部署及解决方案
2013-01-18  作者:企业网 

  自动分层系统(AutomatedTieringSystem,ATS)可以在不同存储层之间迁移数据。如果数据是动态的就会被迁移到靠上的存储层,最终保存在某种固态盘(SSD)中。自动分层系统有很多种,其中影响最小也是最安全的使用方式就是将其作为保存动态数据的缓存。


  缓存类型的自动分层系统将动态数据从传统机械存储中拷贝到基于高速内存的缓存(RAM或者闪存固态盘)中。在这种拷贝模式中,自动分层系统被用作一个大型的读取缓存,几乎不保留数据的唯一副本。即使当他们通过缓存入站写入的写入加速器,保留唯一数据副本也仅仅需要几分钟的时间。在这些模式下,这些系统可以帮助云存储技术为更主流的存储要求提供服务。


  云存储系统也分为几种形式。比较常见的一种是作为NAS存储型的“价值层”,具有极高的成本效益和高度可扩展性。但是这种成本效益和可扩展性通常是以牺牲性能为代价的,使得基于云的存储系统无法被更多地用于主流的存储资源。很多用户和提供商希望能够更广泛地部署云存储,并利用自动分层系统来填补这个空白。


  然而,当被用于更主流的用途时,云存储系统将带来一个挑战,那就是他们通常是软件解决方案,有时候采用了提供给用户的通用硬件和磁盘驱动器。这使得成本降低下来,因为数据集被分布到多个类型的存储硬件中。现在主要的存储制造商都将精力放在了交付用于他们一级存储平台的自动分层系统上,在提升性能的同时控制住成本。然而一级存储并不常用于云存储部署中,而且主要的存储制造商也都坚持在他们的低端存储系统中提供自动分层系统技术,防止这些性能升级的系统影响到他们的一级存储市场。


  平衡性能差距和异构存储要求有一套来自致力于在外置存储设备上交付自动分层系统的存储提供商的自动分层系统解决方案。然后可以将这种解决方案放置于云存储网络的前端,不过这时候你可能要面对用户或者应用如何访问数据的一些挑战。


  自动分层系统解决方案部署就绪之后,所有网络传输都将通过这个系统。自动分层系统设备会对存储传输进行分析,然后根据它的访问特性,将动态数据块保存在高速存储层中--通常是RAM或者SSD,也可能是高速SAS。因为对这些数据的读取操作来自于高速存储区,因此可以快速地交付给用户或者应用。


  在基于NAS的云存储中,有很多种应用实例是要求有更高的性能。首先是安装一个比传统NAS成本更低、可扩展性更高的NAS云存储系统;一个内部私有云存储系统。在这种应用实例中,不可避免地需要比云存储系统本身设计交付更高的性能。向云存储前端添加自动分层系统往往可以解决大多数性能问题。


  第二个使用实例就是更经典的“云存储提供商”模式。如果一个提供商的某些用户拥有一些突然变得非常动态的数据,那么这些数据就可以被迁移到自动分层系统中。尽管这些数据的大多数请求可能是从一个速度较低的连接访问这些数据,但是1000个用户的访问合起来就可能导致存储方面的瓶颈。


  大多数云存储系统是“松散集群的”,这意味着单个节点的性能会成为瓶颈,因为数据并没有像和紧密配对的集群一样被分布到节点中。结果是,如果一个文件被频繁访问,那么每次它只能从一个节点被读取。解决方法就是,将这个文件拷贝到集群中的多个节点,然后改变应用以了解还有谁需要这个文件。除此之外,如果对这个文件的访问频率降低下来,则需要找到这个文件的冗余副本并进行删除。在大多数情况下,最后一个步骤很少发生,这就导致大量的空间浪费。这样就要求存储管理员付出更多额外的管理时间。


  另外一个更简便且更有效的解决方案就是添加自动分层系统。系统分层系统会将访问频繁的文件(或者文件片段)迁移到RAM或者基于固态盘的缓存区中。然后,当文件被频繁访问的时候,系统就会从高速存储区提供这个文件。这种方法不需要对环境进行变动(或者变动有限),当文件被频繁访问的时候可以被识别出来并迁移到高速存储中。然后,随着访问频率降低,文件将被自动迁移到缓存中。因此,存储就变成可自主管理和自主调节的存储。


  自动分层系统解决方案通常被用于加速高端NAS。这些系统已经拥有高速磁盘子系统和多个高速网络连接。高端NAS被用于交付机械驱动器所能提供的最佳性能。在更换整个存储阵列之前,自动分层系统往往被作为最后一种解决方法。


  另一方面,NAS云存储系统并不一定具有和传统NAS相同的性能水平。正如前面所说,重点往往是成本削减和可扩展性,以牺牲性能为代价。随着云存储环境的扩展--或者随着云存储被更多地用于主流应用中,原始存储性能的欠缺迫使存储经理考虑选择更传统的解决方案。他们可以考虑的选择之一就是不限制存储的自动分层应用。这两种技术的结合将提供更高的性能,同时保持了成本和可扩展性方面的优势。