探索中国CIO人才现状 | 第四季调研报告
谁会是Hadoop大战中的最后赢家
2014-03-08  作者:企业网D1Net 

  虽然开源Hadoop供应商掌握着最好的产品,但Forrester称那些有更好策略的大企业才是最终胜利者,真的是这样吗?


  大数据的核心即Hadoop是一个用于存储和处理大数据的开源架构。多年来开源初创公司Cloudera和Hortonworks在Hadoop市场一直占有绝对优势,而专有软件供应商Oracle、微软以及其他一些公司也想在这个市场占有一席之地,如今它们很大程度上是通过与专业的Hadoop初创公司建立伙伴关系间接地参与市场争夺。


  根据Forrester的最新报告,老牌技术供应商会采用出强势的产品战略,即使它们当前的Hadoop产品仍有许多有待完善的地方。让人不解的是专有供应商们却希望提供基于开源项目的稳定产品,可它们所做的贡献太少,因此也很难有太大的影响力。


  Hadoop发展趋势


  正确把握Hadoop发展趋势并不难,就像Forrester说的那样,Hadoop未来的发展主要取决于不断变化的数据基础设施,而且Hadoop已经“形成了未来灵活数据管理平台的基石”,换句话说,如果技术供应商想要跟上现代化企业步伐,它只需要一份关于Hadoop的报告。


  Hadoop很有吸引力,因为它使企业能够以较少的成本存储和分析大量数据。Forrester发现,企业目前分析的数据只占到企业总数据的12%,某种程度上,是由于它们不知道该如何处理数据造成的。


  Hadoop可以轻松实现大数据,因为它支持企业以更低的成本存储数据,一旦它们找到分析数据的最优办法,就可以对数据进行处理。


  虽然是这样,但也可能导致一些企业将Hadoop看作“无人监管的数字垃圾填埋场”,企业正变得越来越了解Hadoop和大数据——通常情况下,企业将Hadoop的分析能力与NoSQL数据库这样的实时数据处理引擎结合在一起,用以从企业数据中收集情报,并及时采取行动。


  用成熟的眼光看Hadoop,什么样的供应商值得关注?


  影响力和发言权


  让人不解的是,Forrester建议我们不要仅仅关注那些在Hadoop上投入大量资金的供应商。


  在开源领域,成为代码源甚至要比占有源码更为重要。同样,专有软件供应商靠软件授权收费,因为它对自己知识产权保密,开源供应商的市场力量与供应商对开源项目的影响力有直接关联——也就是说放弃的知识产权越多,在开源领域的影响力就越大。


  这就是Forrester的分析在我看来并不完全正确的原因。不要只注重供应商Hadoop服务的当前状态——Hadoop初创公司很受追捧,只是因为它们对Hadoop发展作出的贡献最大——Forrester暗示未来真正的赢家应该是IBM、AWS和Pivotal这样的大型技术公司。


  出人意料的是,尽管“战略”包括了许可、定价、执行力、产品路线图和客户支持,Forrester对所有公司的社区扩展活动不作任何评论。像之前ReadWrite报道的那样,由于对Hadoop发展贡献的很少,像IBM和AWS这样的供应商很难决定Hadoop发展的方向,Hadoop创始人(Cloudera雇员)Doug Cutting断言:


  @mikeolson 我不指望所有公司都为社区贡献一个项目,但那些不作出贡献的公司在Hadoop领域将没有发言权。—— Doug Cutting(@cutting)November 13,2013


  同样,Hortonworks首席执行官Rob Bearden表示:社区是保证Hadoop技术精密联系的关键。


  Hadoop正在逐渐成为现代数据体系结构的基石,而且我们仍会努力做出贡献回报社区,确保作为下一代数据平台的新Hadoop内核能够将潜力全部发挥出来。


  搭“顺风车”的策略真的很成功吗?


  追随者还是领导者


  有时开源就像生活——并不完全公平。亚马逊在MySQL上投入了大量的资金,比MySQL或者Oracle(后者通过收购Sun公司得到MySQL)花的还多。同样,IBM 在Linux上花的钱比Linux领域的领导者Red Hat还多。


  但Forrester的观点可能也不完全正确,例如,在“客户支持”领域,Hortonworks 的贡献可以打满分,这合情合理,因为Hortonworks为Hadoop贡献了很多代码,但Pivotal和IBM也是满分,这是不合情理的。


  Forrester是觉得这些公司可以为Hadoop专有产品提供更好的客户支持吗?那些对开源项目发展没有多少贡献的供应商,它们的客户支持能力也无法和投入很多的供应商相提并论。


  可以肯定,Amazon和其他公司将来会构建基于Hadoop的优质服务,但最终它们在Hadoop上将难以提供很好的客户支持,因为它们没有为Hadoop的发展作出贡献。因为,它们在项目上总是被迫成为追随者,而不是领导者。


  Shaun Connolly是Hortonworks公司的战略副总裁,他写信告诉我:“制定战略要考虑到各个方面,能在产品路线图和客户支持等领域的战略上获得满分,我们感到特别自豪。


  他确实应该感到自豪,这也是Hortonworks(还有Cloudera)这样的公司能够为它们客户保证优质服务的重要原因。


  谁才是真正的赢家


  看来Forrester的Hadoop供应商排名与Hadoop本身关系不大,更多与Hadoop如何融入公司长期产品战略相关,比如IBM的产品战略,Forrester写道,“IBM的产品路线图包括继续将IBM其他产品(如SPSS高级分析,高性能计算工作的负载管理、BI工具以及数据管理和建模工具)与BigInsights Hadoop解决方案集成到一起。”


  换句话说,对这些供应商而言,Hadoop只是一个很好的补充——而不是主要部分。


  这一点无可厚非,毫无疑问,IBM、AWS和其他公司通过Hadoop丰富其产品会赚很多钱,但对于那些想要从Hadoop本身获得价值的公司,它们可能更容易从那些对Hadoop发展贡献较大的企业(Cloudera和Hortonworks)那里获得好处,只有这些始终为社区做出贡献的供应商推动着Hadoop的发展,并且为Hadoop提供更好的支持。从长远来看,只有始终站在行业最前沿,只有真正关心产品,只有为用户提供最好技术支持的供应商才能长久的生存并发展下去,他们才是真正的赢家。