探索中国CIO人才现状 | 第四季调研报告
让数据中心成为业务创新基石
2013-07-21  作者:网界网 

  作为一家融保险、银行、投资等金融业务为一体的整合、紧密、多元的全牌照综合金融服务公司,中国平安保险(集团)股份有限公司(以下简称“平安集团”)正在信息技术高速发展的大潮中不断创新发展。希望在传统金融业务之上,依托于互联网技术进行资源整合及业务创新,以期将已有的金融业务进一步拓展,履行“专业让生活更简单”的企业理念。


  近日,《网络世界》记者有幸采访到了中国平安集团下属平安科技公司基础架构管理部机房分组经理王国兴,他与记者分享了平安集团信息化业务建设的基础及平安数据中心建设与运维管理的经验。


  适时进行数据中心建设支持业务发展


  王国兴介绍到,随着互联网的快速发展,传统营销模式正在受到冲击,甚至互联网公司也已经计划进入金融领域。面对传统竞争对手,以及新晋互联网企业的双面夹击,平安集团也意识到一旦互联网公司借助其庞大用户群来拓展金融市场,将会对传统金融企业带来巨大冲击。而且集团自身也需要进行业务创新,以提升差异化竞争的实力。因此,平安集团正在探索如何通过移动终端为客户提供互联网金融服务,使得用户可以坐在家中即可理财、投保,一切都通过网络来轻松进行。


  上述一切理想要最终“照进现实”,必须要有“大后方”的强力支撑。平安科技在华东、华南建有两大数据中心,分布承担整个集团的IT生产与容灾需要。随着中国平安综合金融业务的快速发展,特别是平安保险、平安银行、平安投资等子公司完成数据集中与新一代综合业务体系后,数据中心设备所承载的业务激增。为满足集团发展的需求,平安科技在原有数据中心的基础上于2008年筹建了新数据中心。


  平安新数据中心的建立目标是基于能够保障集团未来一段时间内的业务发展需要,立足建设一个布局合理、功能完备、设施先进、运行稳定、使用灵活,同时又能体现工艺精湛、美观大方、绿色环保的高可用性的现代化数据中心。


  模块化布局实现数据中心高效与灵活


  平安新数据中心整个项目采用模块化建设方式,结合整体容量满足集团未来发展需求。单模块设计最优化的原则,将整个数据中心划分为多个模块。一次性完成土建、预留充足基础供电、制冷容量与区域,并考虑有一定的富余,借以应对未来IT飞速发展带来的高容量数据中心需求。各机房模块将分期投产建设,以降低总拥有成本(TCO)。


  王国兴表示,公司的发展是一个渐进的过程,因此公司数据中心的建设也应遵循这样一个过程。在前期建设时要把厂房先建设好,机房内部只建设当前需要的部分,当未来业务需求上升时,再对未使用的机房模块逐步建设投产。然而,分步建设最大的问题来源于在后期建设的时候不能影响到前期已经投产机房的正常运营,尤其是对于金融业务来说,当前的运行模式已经不能让数据中心做中断性变更。因此,为了最大限度地满足使用功能的要求,使得布局更加合理,使用更加方便,将使用效率推上新高度。同时充分利用公共空间,减少机房的一次性投入,灵活应对。为了IT科技发展的难于预知性,数据中心的模块化就势在必行了。因此,平安科技将模块化和标准化的思想贯彻到了数据中心的建设过程中。


  王国兴解释道:“基于上面这些考虑,我们就需要将模块化的东西实现真正的模块化,包括供电、消防、制冷、弱电通讯等等”。较早之前数据中心的所谓模块化,只是预留机房扩展空间,而基础设施还是共用的,这样再建设时就要整体进行改造,影响非常大,甚至造成已投产区的运行中断。如在配电上,平安数据中心的各个机房模块独立对应自己的配电房,独立地使用自己的变压器、低压配电柜、UPS等,将共用情况降到最低,仅仅保留高压配电房共用。


  平安的新数据中心每层分为左右两个对称模块,将供配电系统随每个模块分层设置。这样设计的优点不仅在于分期建设便利,而且使得低压线路较短,有利于节能和节材。另外,变压器距离机柜较近,易于降低“零地”电压。


  立足实用的综合布线设计实现安全与高效


  如果说数据中心是支撑整个平安集团业务运行的关键所在,而综合布线作为连接数据中心内部各个设备的“经络”,其质量高低则直接决定了整个数据中心是否能够可靠运行。因此在数据中心机房内的综合布线是遵循国内GB50174-2008标准和国际TIA942/-A标准,采用主流产品,即铜缆采用CMP增压级高阻燃的CAT6A非屏蔽铜缆,光缆采用OFNP增压级高阻燃的MPO预端接OM4光缆。使得平安数据中心的弱电通讯同样实现了安全可靠与绿色环保。


  面对庞大的服务器数量,以及每台服务器有着近10条的铜缆或者光缆的使用需求,网络线缆排布的科学统筹也成为了一个新的挑战。王国兴表示:“布线的实用性一直是我们比较重视的部分,在以往的机房中尝试用列头的方式,但是随着线缆数量的提升,这种方式已经不能满足我们的需要,必须进行改进。于是我们自己讨论总结出了交换机置顶的方式,后来才发现,之后这种方式逐渐成长为了业界的一个流派,即所谓的ToR(TopofRack)。从这方面也同样看到,如模块化一样,这些设计理念的创新其实就是大家在日常实践过程中为解决所遇到的问题而自然出现的,并不是为了技术而技术、为了创新而创新。就像平安早在2004年就采用服务器虚拟化的技术,也是因为发现了服务器资源利用不充分而开始适用的解决方案。”


  综合布线的质量很大程度上决定了整个数据中心运营的稳定性和可靠性。王国兴介绍道,康普不仅提供了稳定可靠的线缆产品,其解决方案也在机房设计方面满足了我们的需求。比如为了充分利用空间,也考虑到美观因素和日常维护的便捷。平安数据中心没有采用桥架上的配线方案,而是采用了康普的解决方案,将独立机柜的小型机和存储主机采用高扩展性的区域布线箱设计,安装在架空地板下。这样也为临近的独立机柜提供了足够数量的跳线连接并预备了未来的扩展。


  从细节入手打造安全可靠绿色节能数据中心


  在数据中心运营组件中,冷水机组及水泵是能源消耗大户,为节约能耗,平安数据中心将为冷冻设备提供电源的变配电室尽可能靠近冷冻站,以减少电能损耗,并配有中央储冷系统,借以提高制冷系统可用性。冷冻机、循环水泵等动力设备选用技术性能好、运行可靠、能耗低、自动化水平高的设备。冷水机组满负荷时的COP值大于5.6以上。另外,机房空调采用双冷源机房专用精密空调,既可以使用冷冻水,也可以采用自带压缩机进行制冷。同时采用群控技术,为机房内的IT设备提供了可靠、充分的制冷保障。机房内部采用地板下送风,天花板上回风,精密空调采用回风管直接与天花板对接。计算机房采用铝合金微孔方板吊顶,热通道上方吊顶做铝合金回风格栅,整个机房吊顶作为回风箱的设计,最大限度地提高了制冷效率。


  建设是一时之工运维是长久之作


  平安集团作为大型综合金融企业,IT系统的集约与高效一直走在国内金融企业的前列。王国兴表示,平安科技所运行的这两大数据中心为集团业务开展提供了不间断的原动力。数据中心一旦出现异常将影响集团各业务的正常运作,因此平安科技组建了一支由操作员、技术员,以及工程师等组成的专业化数据中心运维队伍,并建立一套涵盖到机房日常巡检、设备维护、应急演练与故障响应处理在内,且通过了ISO9001专业认证的标准化工作流程,确保了平安数据中心的高可用性。


  在实现高可用性的基础上,平安数据中心的日常运维中也始终贯穿着绿色运行节能环保的理念,其中多维度思考节能问题也是平安数据中心的特色之一。据王国兴介绍,由于每个模块的服务器数量都是一步步提升的,因此空调也是循序开启的,是根据模块内容量的上升来设计空调开启的数量。包括UPS的运行也是遵循这样的思路。在不影响可用性要求的冗余配置前提下,根据模块内运行设备的容量来决定UPS的使用。甚至在内部灯光的使用上,也是保证不影响摄像头照明的前提下关闭最多一半的灯光。通过从大到小、从外至内的多方面节能策略,逐步提高了冷冻水系统的出水温度,并通过实测找到了最佳节能点。细节出实效,通过一些列运维节能措施的实施,实现了每年近两二万元的电力费用节省。这不仅仅是费用节省,这更是一种运维理念的培养,一种企业社会责任的体现——绿色承诺,平安中国。


  平安集团作为大型综合金融集团企业,各项业务的飞速发展须有强有力的IT支持。王国兴表示,平安科技将在数据中心建设与运维管理上不断探索与提高,为平安集团的发展提供高效、稳定的IT基础保障,为社会树立优秀数据中心建设与运维管理的典范。