探索中国CIO人才现状 | 第四季调研报告
大数据工具的开发尚处于“中世纪”
2013-03-12  作者:企业网 

  从现在的情况来看,原本业务单一的CommVault凭借其虚拟化服务器备份产品Simpana再一次成为了业界关注的焦点。至少,DCIG最新的顾客指南是那样说的。


  该指南是在2010版的基础上更新而成的,它对22款虚拟化服务器备份产品进行了排名。


  DCIG称,这份指南为顾客们提供了一种强大而简单的方法来评测每一款虚拟化服务器备份软件,并且提供了一整套针对每一款产品的各种功能的评分和排名系统和数据表格。这些数据表涵盖了每一款产品的各项参数,提供了每一款产品的备份技术、管理、恢复和支持功能的相关介绍。


  真正的排名是以下表的方式制定出来的:


  建模和分析软件生产商ContextRelevant正努力使得大数据应用程序发展的更加迅速,并努力减少其成本。


  如果你关注大数据行业,你就会知道,数据科学家是很难寻找的。同样的,易于使用的数据科学工具也很难发掘。


  总部位于西雅图的大数据公司ContextRelevan的创始人和首席执行官StephenPurpura表示,现在开发的大数据工具属于“中世纪”阶段,他希望接下来的创业公司能够解决这个问题。


  ContextRelevant能够提供托管和内部部署数据分析软件。它的应用程序能够在Hadoop以及其他MapReduce引擎上使用,从而能够完成包括欺诈检测、单击预测以及为Splunk的大数据搜索和分析软件工作的商业任务。


  ContextRelevant可能是个新的公司,但是他们有着非常丰富的大数据经验。例如,该公司的工程副总裁吉姆·沃尔什曾经领导过微软宇宙分布式数据存储和分析环境的发展工作,该项工作是以包括Bing在内的许多微软产品的发展为基础的。


  Purpura在接受信息周刊的电话采访时说道:“我们专注于预测分析的应用程序,因为我们的团队大部分是由机器学习专家构成的。这是我们的增值价值。”


  当然,ContextRelevant并不是预测分析应用程序的唯一生产商,它有着很强大的竞争对手,如OperaSolutions、PalantirTechnologies以及大名鼎鼎的IBM和SAP.Purpura说:“我们的基本解决方案将能够在从一台笔记本电脑到一个大的、1000个节点的Hadoop集群范围上应用。”


  那么ContextRelevant是怎样让自己在这个领域脱颖而出的呢?Purpura说:“我们正在使用机器学习,从而使得水平应用能够


  自动配置自己的数据。”他还补充说,他的许多竞争对手都集中于“垂直的、具体的”应用程序。


  客户可以使用ContextRelevant的源代码来快速构建他们的大数据应用程序。Purpura表示:“我们的基于Hadoop的数据库源代码是非常小的。它通常是由几百行甚至是更少的Python代码构成的。所以它是非常容易理解的。”Purpura指出,对于一个客户来说,ContextRelevant公司的方法能够使得基于预测分析的应用程序的开发时间从数月缩短到数天。


  即使那些对数据不是很了解的人也能够读懂源代码,从而更好地理解究竟发生了什么。他们可以基于这样的一种理解,去开发出一些风格上可能很相似,但是使用上却更方便的应用。”


  欺诈检测是ContextRelevant另一个技术前景看好的领域。


  Purpura说:“一旦你有能力解读大量的数据,你就能制造出足够的基准线,从而知道人们究竟是如何提出建议的。”


  他说:“发现人的异常行为方式实际上是很容易的。我们的系统可以在很接近实时的时间里做到这一点,该速度远远超过市场上现有的系统。”


  ContextRelevant也许是分析领域的新手,但是它已经在服务客户。到目前为止,其最引人注意的客户是差旅和费用管理供应商ConcurTechnologies,该公司使用ContextRelevant的产品,可以帮助他们及时发现花费异常,从而减少开支。


  Purpura表示其他大型企业客户没有允许ContextRelevant去公布他们的名字,但他同时补充说,将来会有更多企业允许他们这样做。


  他说:“很少有刚刚成立11个月的创业公司,会拥有愿意付给他们大笔钱,希望他们能够提供解决方案的客户。”他还补充说:“市场需求是很火热的。”


  DCIG的虚拟化服务器备份产品排名


  Simpana10排在第一位,NetBackup7.5仅次于它列第二位,随后依次是ARCserve、Eversync、NetWorker、Arkeia的NetBackup和EMC的Avamar,这些产品都可以算作是“优秀”的一类产品。排在最后或可以被归为“普通”的一类产品包括:AcronisVMProtect8、VeeamBackup&Replication6.5、PHDVirtualv6.0、戴尔的AppAssure、EvaultDataProtectionSoftware以及IderaServerBackup。


  DCIG还编制了另一张专门介绍和评价每一款产品的备份技术的表格,最后的结果跟这张表格差不多。如果想浏览那张表格和个别产品的数据表,请访问DCIG网站。


  在2010年版的排行榜中,排在第一位的是CommVault的Simpana9,只比CA的ARCserver215领先一点点。当时排在最后面的是希捷的i365EVaultDataProtectionSoftware。从那以后,与市场上的领先产品相比,EVault并没有得到太大的改善。回到排行榜顶端,ARCserve的排名已经下滑了一位,被赛门铁克的NetBackup超越了。


  *DCIG是一家独立分析公司,有时会接到各厂商的委托而进行一些研究。那些厂商也许会出现在它的顾客指南中,也许不会。据悉,它与厂商之间的委托研究交易不会对厂商在其顾客指南中的排名造成影响。