探索中国CIO人才现状 | 第四季调研报告
在企业中创建一个高效的数据管理流程
2015-07-22  来源:techtarget

大数据的到来可能会带来更多的问题。企业都在尽可能地审核,存储和分类组织各种重要而具有版权信息的数据。

大数据意味着企业需要不断增加数据中心的存储和应付更多的数据量,并分散在用户设备上。

物联网的普及也开始收集来自传感器和连接设备的大量信息。根据市场调研公司预计,从2012到2016,全球大数据存储和服务器市场呈现31.87%的复合年增长率。

这种数据的扩张需要由数据中心的团队进行编目、分类和提取所包含商业信息。所有企业需要采取符合法规的方法来进行数据管理。

你所拥有的数据

将数据组织化是企业迈向更好数据管理的第一步,信息化通常是一个繁琐的过程,企业必须先确定所产生或收集的信息进行信息化处理。数据中心团队必须整合保留在中央服务器、台式机和移动设备里的库存数据,并且需要确保高层管理人员支持你的数据管理计划。因为普通员工对部门的数据了解得更多,但他们并不重视技术问题。

你可能会发现一些业务信息的数据会有重复,比如某一个客户的记录分别存储在六个不同的应用里面。通常,信息技术在每个实例中的数据都有不同的格式,这样让数据变得难以在不同的系统相互通用。数据整合和标准化是一个耗时耗力的过程,IT团队都在致力于寻找各个应用程序/系统之间的通用接口,从而使不同程序和系统的数据可以通过标准的接口进行融合调用,而不影响其原来的系统。

接下来,企业需要对收集到的数据进行应用和功能的分类。这个过程将涉及数据中心的容量规划,其中相关数据的使用和符合该公司的实际需求对公司来说是一个大计划。数据价值的评估很难有一个绝对值。如果数据变得滞后或丢失,企业需要尝试评估潜在影响的业务,这时需要召集技术、管理和业务等部门将数据进行分类和检索。

数据去哪了

一旦把信息分类,就需要配置一個数据层。每个企业对数据存储都有一定的预算资金来应付数据的存放,但并不是所有的数据都需要放在最顶级的储存设备里面。

在高性能存储阵列中,可供选择的产品越来越多。闪存存储比磁盘数据访问速度快,延迟更是低得多,但它比其他存储产品的成本高约20%-100%,甚至更高。目前闪存从成本上注定不是一个可以完全代替磁盘的储存,虽然闪存可以缩短关键应用程序的响应时间,但一方面在数据恢复层面,闪存目前还有缺陷,另一方面容量暂时也无法和传统存储相比。

除了闪存,服务器的另一个高性能存储方案是SAN。如戴尔的PowerEdge和富士通PRIMERGY等高端服务器依赖软件定义的存储,相当于将整个存储系统进行虚拟化。

另一种选择是专用存储系统。这种存储系统自动运行重复数据删除和备份过程。理论上,这些系统帮助系统管理员通过减少了配置工作,不需要去手动保留和备份数据。另一个好处是通过删除重复数据提升了性能。

如何管理好数据

集成是数据管理过程中的一个重要部分。要建立起层次化的数据管理,一个公司必须有数据存储管理软件,能够在不同的硬件系统之间迁移和收集信息,但目前的IT公司很少愿意或能够在一个应用平台上进行规范化。因此,数据的存储需要支持多种平台,如linux和Windows,以及VMware和微软Hyper-V的虚拟化,并包括数据保护。这需要一个标准,它可以允许各种存储相容和处理系统中的信息流,并能够存储、关联、分类和搜索的企业中的这些碎片化数据。

识别和管理不同存储系统的数据,以防止数据的交叉扩散,这是一个需要花时间去做的事情。一些关键的应用程序经常会和多个储存系统相关联。例如在分层存储,磁带系统可能较少访问ssd系统里的信息,但在主系统需求数据的时候又会将数据移动到主系统处理。如果SSD系统和磁带系统互相融合,但没有进行识别和管理,会导致应用程序容易出错。在今天这个日益虚拟化的数据中心,这种链式储存是一个共同的缺点,需要注意去避免。

高优先级的信息应该优先保留在高可用的(意味更贵更高级)存储系统中。这种存储从廉价易部署的磁带系统到不间断的实时储存系统都有。随着科技的进步,存储系统也在不断的进步,选择存储系统应该从实际出发。

企业通常会进行存储的备份。传统的备份是在数据中心将数据复制一份,但新兴的云端异地储存是新兴的存储方式,可以进行考虑实施。