广西梦之岛集团(以下简称“梦之岛”)是广西的大型百货企业之一,在广西各主要城市拥有旗下大型百货零售商场十余家,已成为广西展示时尚文化与国际接轨的一个重要窗口。
自创建以来,梦之岛不断引入业界先进的管理理念与技术,其中梦之岛信息部门以强有力的IT运维手段,保障梦之岛信息化进程顺利实施,助力企业在服务竞争力日益关键的今天赢得了市场先机。
IT运维如同“人体小脑”
在部署IT运维系统之前,梦之岛所有IT相关人员被划分为一个部门,人员责任按业务区分,分别负责进销存、OA、财务等业务系统。除此之外,还要负责管理各自业务系统的服务器、数据库、网络设备等。这种松散型管理结构,使得业务需求、系统设备无法同时兼顾,部门人员虽异常忙碌,但处理问题的效率却较为低下,更有甚者会出现错误。
大约在2006年,集团发现了这种管理弊端,就开始对相关人员进行统一规划管理。集团创建了IT部,并将其划分为研发和技术两个部门。研发部负责处理、解决业务部门需求问题,而技术部则负责数据库、服务器、网络、信息安全等IT基础运维。如此一来,整个IT部门分工更明确,管理更细化,从而使得系统更稳定,业务更有效。
而谈及对于IT运维的理解,范憬钊采用了一个较为形象的比喻形容出IT综合运维在企业里真正的意义。他表示,如果把百货业比喻成一个个体,那么百货的主营业务,如供应商管理和客户管理等就是人的大脑,而IT综合运维管理则更像人的小脑。小脑对人体的管理是无知觉、自组织的,人在健康的时候无法觉察、意识到它的存在。而当小脑受损的时候才会知道它的重要性。而IT运维恰如人体的小脑一样,运维管理着企业的系统、安全、网络以及数据库,这些东西正常运行的时候,企业的各种业务运行较为流畅。一旦发生故障,就立马会体现出它的重要性所在。这就是IT运维及IT建设的“基础性”。
IT运维远离“救火员”角色
在许多企业中,IT运维都处于被动救火员的状态。在曾经的梦之岛,这样的事情也曾发生过。据范憬钊介绍,在有一年的年终促销过程中,收银机突然无法运作,款项无法正常收付,最终经过3个小时的排查,才发现是由于一台收银机的小型交换机自身环路而导致了这场网络风暴。故障最终虽然解决,但也给梦之岛带来了不可估量的营业损失。这件事让范憬钊深有感触:“遇到突发情况,不能快速解决问题,有事情就很忙,抢险做不到提前预防,这是很头痛的问题。无法预测则无法提前规避风险,许多突发性的问题则无法有序的整理相关预案机制。”
相较其他行业来说,零售百货行业在IT维护相对较为繁琐,具体表现在运维的区域范围大、散、多,信息资源十分松散,缺乏对信息资源的统一管理和监控。造成这种局面的原因在于企业组织架构的扁平化,而扁平化正是连锁企业的普遍特征。用常见的快餐连锁和百货连锁来对比,就会发现在“总部”一层其实都比较类似,均建设有复杂的信息中心。不同点在于分店,快餐连锁的分店小,网络布线简单,收款台相对集中。而百货连锁一个分店就是一整栋楼,网络布线相对复杂、收银台零散分布,特别是不同品牌专柜的多样化网络需求,这些都是快餐型连锁所没有的。
针对以上问题,梦之岛进行了一系列措施的改进,并采取了制度管理和部署工具软件相结合的方式来解决。一方面,梦之岛在制度上就制定了许多标准化的流程,在分店开业的装修期,就从分店网络拓扑设计、网络访问策略、网络施工布线、工程的验收等方面去控制每一个施工步骤的工程质量。在分店的正常运行期内,也有设备巡检、变更管理、设备配置登记等流程去保证IT资源的正常运行或变更。另一方面,梦之岛在部署工具软件上也不曾落下,集团部署了一套信息资源监控软件,对集团所有的数据库性能、服务器健康状态、网络设备、网络流量进行实时监控,设备有什么故障或者隐患都能及时预警,可以有效防止信息系统故障发生,并可以在故障发生时能快速定位故障点。
就是这样一环扣一环的IT运维行为、标准化的流程化制度使得梦之岛IT综合运维系统每个环节都被精密地控制起来,提高IT管理效率,真做到发生故障能快速定位,让IT运维不再仅仅只充当救火员的角色。
IT运维管理也需环环相扣
由于每个集团的系统都具有自身的特殊性,多个系统之间也存在兼容性问题。梦之岛采用的IT运维软件并不支持梦之岛特定操作系统下面的基础实施。对此,梦之岛方面采取自主主撰写脚本和代码让其与之兼容。除此之外,他们还进行了深层次的改造,与短信系统结合在一起,当发生一些严重的问题时,告警会直接发送短信到工程师的手上。
正是因为经历了这些,范憬钊对于如何选型IT运维管理系统以及事先需要准备的事项方面也有一些自己的认知。他认为,所有IT运维管理行为都是一环扣一环的,每一个环节都很重要。建立标准化的流程,就是为了把每个环节都控制起来,进行精细化管理,细化到设备的每一项配置都有据可查,为的就是减少人为错误,减少设备故障的发生。另外,他提到引入IT资源监控的工具也很有必要。要部署IT运维系统,首先要先统计和明确好企业的IT资源,以及希望监控的内容和监控的具体层级问题,设备何时良性运营等均需要提前做好调查准备。
目前,梦之岛的IT综合运维系统功能非常细致,实现了对集团数据中心的IT基础架构及多个商场经营系统数据库性能上和流量上的监控管理。提前预警则会通过设定阙值提前预警,避免系统资源耗尽导致服务停机或宕机。设备监视会运用到多方式报警功能,某些设备性能达到极限时,会通过发邮件或者警告灯的方式进行预警。而运维报表功能则会在每月初形成一个报表,显示很多服务器数据在当前月份或星期内的运行情况。
IT运维的部署,让梦之岛原来许多隐藏而无法发现故障均暴露出来,让梦之岛系统故障发生的概率大为降低。更重要的是,真正发生故障的时候,也可以速度定位故障点,提高效率,提高管理效果。通过IT运维的部署,梦之岛自身制度的改革也发生了相关变化,在制度上所做的努力,对流程起到了一定的优化作用,但范憬钊强调说,制度上的改革和优化是长期的、持续性,这方面要做的努力不单是一个工具就能替代的。
最后,范憬钊告诉记者,企业的IT综合运维管理能力和整个行业环境脱离不开,不可能有超出行业太多的技术或能力。如果说对未来有期许,他希望IT综合运维能再提高自动化和智能化的能力。未来他希望能把更多的事情交给系统去实现、完成。