探索中国CIO人才现状 | 第四季调研报告
百度云数据中心采用ARM架构
2013-01-31  作者:企业网 

  尽管更换ARM架构服务器,在百度内部并不算最重要的项目,但对整个数据中心领域来讲,却是大事件,这在某种程度上意味着,此前英特尔x86架构的垄断局面已经被打破,并且将可能有越来越多的供应商加入ARM阵营。


  1月11日,中国科学院原秘书长、国家科技重大专项国务院咨询评估组专家侯自强,来到百度南京数据中心,和他一起的还有中国工程院院士倪光南以及工业和信息化部电信研究院传输研究所副所长石友康等人。他们看到的是百度全新的ARM架构服务器,一个2U机箱装6台,每台4个3T硬盘,每个机箱共72TB,功耗300W。侯自强透露,如果采用x86的存储服务器,相同功耗存储容量只有36TB,即整机功耗降低了50%。


  据一位百度内部人士透露,百度正在其全国各地的云计算数据中心推广该技术。


  对百度来讲,这完全是一次成本角度出发的选择,采用ARM架构的芯片成本只有英特尔x86架构芯片的10%,整个数据中心的存储密度可以提升70%。


  侯自强告诉记者,互联网公司做云计算是大势所趋,百度是全球第一个大规模商用ARM架构的服务器的公司。在这样的推进之下,一直非常想进入云计算服务器领域的ARM很可能将因百度这个超级用户一改此前的缓慢步伐,以存储应用为突破口快速进入数据中心的腹地。当然,现在英特尔也在进入ARM的强势领域--移动终端。


  三部联合


  百度公关部拒绝对此事透露任何实质性信息,但记者从百度内部某知情者处了解到,这是百度内部一次跨部门的大项目--横跨了百度系统部、移动云和基础架构部三个部门。


  由于“百度云”在百度内部被定位为非常重要的业务,因此百度在2011年第四季度开始调研,研究云存储中冷数据(很少被读取的数据)的更经济的存储方法。当时参与这个项目的百度工程师研究了各种CPU平台,最后决定采用ARM架构的解决方案,就是因为这个架构解决方案的芯片价格低廉,芯片只是英特尔x86架构芯片的10%,加上硬盘等整体总成本可以下降25%,功耗则可以降低一半。


  2011年12月底,百度的系统部对数据中心服务器采用ARM架构一事正式立项,并确立了两三款CPU平台进行重点考虑。2012年一季度,百度相关部门开始找芯片供应商谈合作,也就在1月,百度确立了云存储是全年的业务重点,负责人为李明远。


  事实上,此前整个数据中心服务器市场上的霸主是英特尔,百度自己的服务器也全部都是英特尔的x86架构。于是百度拉上Marvell和ARM公司一道重新做了开发,从上层的百度云开始重写代码,到系统的重新选择,再到底层硬件,做了彻底的重构,最终实现了指令集变迁,即一套代码、两种平台(x86和ARM)。


  在2012年第二季度整体方案基本成型,同年年中,服务器ODM代工厂向百度交付了样机,经过了几个月的测试评估,2013年第一季度即实现量产,这些服务器在百度南京数据中心开始应用。


  据百度内部该知情者透露,百度在2012年底完成了基于ARM架构的服务器在数据中心的一期部署,目前已进入规模化部署阶段,TCO(totalcostownership总体拥有成本)降幅超出预期,因此百度决心大规模应用这种解决方案。


  据悉,已经部署的ARM服务器目前用于百度网盘,提供个人云服务。


  从ARM获得授权的Marvell大中华区战略市场与销售高级总监郑泓表示,芯片厂商直接与互联网厂商合作研发服务器不论在中国还是在全球是这几年行业发展的新动向。


  供应商误判


  记者了解到,事实上在百度开发ARM架构服务器的过程中,并不是那么一帆风顺。一方面是由于从x86到ARM架构是从复杂指令到精简指令的变迁,64位到32位系统的迁移,另一方面,尽管百度云的规模在中国已经居于领先地位,但在海外供应商眼中,他们并不像Google和Face-book那样“有名”。


  除了美国Marvell公司之外的芯片厂商,起初对百度的态度并不那么积极。知情者透露,那些服务于美国大型网站的芯片供应商认为,国外大厂怎么做,百度就应该怎么做,不用也不应该做过多改动。不仅是芯片厂商对百度不重视,连服务器厂商对百度也“不Care”。


  但这样的判断很快就被百度ARM架构服务器商用的现实扭转。据悉,目前已经有厂商与百度接触,希望能够再度合作。


  百度的“云”在百度内部是重中之重,今年李彦宏给百度规划的主要任务就是--云。其意义在于帮助百度得到手机等移动终端入口,获得注册账户用户,以及开拓个人付费业务,百度云服务要想升级成更大空间则需要每年缴纳从75元到500元不等的年费,如果该业务推广成功,实际上将为百度开拓个人付费收入,而不再只是赚商务客户的广告费。


  2012年百度在“云”上不断投入很见效果,根据百度公司公布的数据,百度云在开放注册不到4个月后用户数就达到了2000万个,百度云中存储的文件总量突破10亿。据悉,目前的用户数已经达到了3000万。


  当然,这一切与百度董事局兼CEO李彦宏的决策密切相关,在李彦宏的战略部署下,百度个人云已经涉及存储、同步和分享等多种需求,用户可在电脑、手机、Pad等全平台使用。


  今年11月份,百度还为三星GalaxyNoteⅡ用户提供了全面的云存储、云协作、云分享、云定制等多项领先的云服务。当时李明远曾对记者透露,百度云就是要深度整合产业链,一方面促进百度从产品到平台的成功转型,另一方面要促进产业链加速向云端迁移。


  随着百度云的规模不断扩大,据悉,目前已经有一些厂商开始“后悔”,回来找百度,希望成为基于ARM解决方案的供应商。


  供应商的立场发生变化,使原本持续在英特尔和AMD之间的竞争现在正逐步转移到ARM身上--未来将是英特尔和ARM阵营之争,而在这场竞争中百度这样的超级云服务提供商则是一个重量级的砝码。


  ARM挑战英特尔


  ARM是一家提供专利技术授权的公司,Marvell、三星这样的半导体厂商在获得ARM的授权后制造处理器,并根据自己的特长进行优化,然后Marvell等半导体厂商将处理器再卖给系统厂商(做手机、平板、服务器等)。现在最大的不同是,他们也开始向百度这样的互联网公司出货。相比之下,英特尔则是自己设计并制造芯片,面向服务器厂商出售,目前也向互联网厂商直接出售,用作定制白牌服务器。


  一直以来,PC与服务器界,In-telInside的标志几乎是不可更改的习惯,但iOS、WindowsPhone、Android这三大平台的手机共同点即手机CPU全都是采用ARM架构芯片。


  据i美股的一份报告披露,2011年全球智能手机出货4.7亿部,ARM架构芯片占90%;功能手机出货6.6亿部,ARM架构芯片占95%;硬盘和固态驱动器出货7亿,ARM架构占90%;数码相机1.5亿台,ARM架构占80%……


  ARM一直以低功耗著称。过去ARM的性能偏低,主要用于手机,后来到平板电脑,现在正在从“小”(例如手机终端)向“大”做(从端向云做);而英特尔的x86(代表PC时代)处理器则以高性能著称,功耗偏高,过去是主要用于PC、服务器等计算机,现在也开始努力降低功耗,从“大”向“小”做(从云向端做),英特尔处理器刚刚被用作联想手机内核--两家公司目前正呈现一种对冲态势,但ARM迟迟还没有进入英特尔的核心腹地,即没有进入用于数据中心构建云计算领域。


  过去是x86架构一统数据中心这个江湖。现在ARM要进军数据中心,就要在云计算体系内构建ARM的生态系统,聚集半导体厂商、系统厂商和用户,现在百度同时扮演了系统厂商和用户的两个角色。此前尽管ARM发布过类似产品,但由于上层的系统和应用无法支持,因此实际上没有正式商用。而百度的解决方案则有可能终止其他厂商的观望。


  ARM企业应用市场经理邵巍透露,百度这个项目对于ARM服务器领域是个重要的里程碑,百度很可能借助ARM技术引领新一代云数据中心的发展方向。目前ARM与世界上第一阵营的互联网公司都有合作,2013年将会有更多ARM服务器部署的消息。


  清华计算机系主任陈文光教授指出,目前百度应用的ARM解决方案主要是存储云服务器,还没有替换高端计算类型的服务器。不过据百度内部人士透露,未来ARM一旦推出64位解决方案,百度则很有可能将立刻跟进,可能将其他的搜索服务器也替换成ARM架构的。