每个追寻大数据的组织机构都对它寄予厚望,希望它可以回答长期的业务问题,让企业在市场中具有更多的竞争力,更好地交付产品和服务。然而在这种热情之中,很容易产生对大数据的虚假期望——有些好处永远不会实现,除非你借助一定的“帮助”。以下就是大数据不会为你做的10件关键的事情,除非你采取正确的步骤来优化它的价值。
1、解决你的业务问题
大数据不会解决业务问题,解决问题的是人。只有那些在采用大数据之前冷静地坐下来考虑他们想要从中获得什么的组织机构,才能获得他们一直在寻求的商业智能的成果。
2、有助于你的数据管理
IBM声称全球每天会生成2.5亿亿个字节的数据,其中大多数数据是大数据。不出所料,全球企业中受管理的数据正在成倍增长。随着数据快速累积却没有明确的数据保留和使用策略(尤其是针对大数据),那么机构组织就要面对管理这些数据的难题了。
3、缓解你的安全担心
对于很多企业来说,确定对数据的安全访问仍然是一个开放的话题。这是因为针对大数据的安全实践,并不像系统记录中的数据那样已经限定好了。我们正处于这样一个时间点,IT应该与终端用户合作,确定谁可以访问哪些大数据以及相应的分析结果。
4、解决关键IT技能领域
大数据数据库管理、服务器管理、软件开发和业务分析技能都是供不应求的。这在很多IT部门已经匮乏的重要核心IT技能上有增加了额外的负担。
5、减少遗留系统的价值
如果有的话,在大数据时代,记录在案的遗留系统要比以往任何时候都更有价值。通常情况下,这些遗留系统为如何更好地剖析大数据提供了关键线索,让数据分析可以回答重要的业务问题。
6、简化你的数据中心
大数据要求并行处理计算集群和不同于传统IT转型的系统管理模式以及数据仓库系统。这意味运行这些新系统所需的能耗、冷却、软件、硬件和系统技能也将是不同的。
7、改善你的数据质量
传统事务处理系统的优点在于,会有固定的数据字段长度,对数据的全面编辑和验证,有助于让其转变为相对干净的格式。对于大数据并非如此,大数据是非结构化的,可以是任何一种格式。这让大数据质量成为一大难题。数据质量是至关重要的。如果你没有数据质量的话,你就无法信任数据查询的结果。
8、验证当前的投资回报率指标
从记录系统中衡量投资回报的最常用方法就是监测交易的速度,然后推断这在获得收入方面意味着什么(例如每分钟你能获得多少个新的酒店预定)。交易速度对于大数据处理来说并不是很好的指标,可能需要数小时甚至数天时间处理大规模数据并运行数据分析。相反,评估大数据处理效率的最好指标是利用率,这应该在定期基础上高出90%(与交易系统相比,后者可能只有20%)。开发这些针对大数据的新ROI指标很重要,因为你仍然需要说服CFO和其他业务领导在大数据上进行投资。
9、减少“噪音”
大数据中95%都是“噪音”,对商业智能贡献很少或者几乎没有。过滤这些数据、获得能真正帮助企业的情报将是一件艰巨的事情。
10、每次都管用
多年来,大学和研究中心运作了很多大数据实验以得出基因组、药物研究以及外星生命方面难以捉摸的答案。虽然这些算法和查询中很多会产生结果,但更多的是没有定论的。大学和研究环境对于没有定论是可以容忍的,但是在企业环境中就不行了。这是IT和其他关键决策者需要管理期望的所在。