探索中国CIO人才现状 | 第四季调研报告
IT Manager 人生之一 运维之道
2009-09-21  作者:齐世忠 

《道德经》 第四十二章,一生二,二生三,三生万物。

此话乃指万物生长的之道皆由一演变而来,看似简单的事物,实际蕴藏着万物。那么在IT管理中,IT的运维则是这万物中的一。

CIO或者说IT Manager 大概有两种出身,一种是从底层最基础的维护做起,通过出色的维护工作,让公司领导对这个人非常认可,同时对IT工作也比较重视,逐步走向IT Manager的岗位。第二种是业务管理出身或者有IT技术背景,具备了一定经验直接进入IT 管理层的人员。

本人基本属于第一种,所以本人对IT运维有着特殊的情怀,先描述一下自己的经历:

我从1997~1999在新会中集工作,中间离开五年,2004年回来,我在新会中集近10年的时间,可以说对于维护工作的重视,贯穿在我的整个工作中。

记得我2004年从电讯盈科回到新会中集,这时也是我正式作为企业的一个IT Manager的时候,当时公司领导张总并没有给我太大的目标,只是问我为什么各部门反映上网为什么特别的慢,如何解决。

先简要介绍一下公司当时的主要设备情况, 包括机房内相关设备(服务器、网络设备等,关于机房设备的维护不在本文中进行说明,以后有专门的章节进行详细说明)、PC(500台)、打印机(30台)、刷卡系统、各种监控系统(我公司有海关、边检、公司内部监控,共100多个摄像头)、各种专线,内部网络布线,还有不定数量的客户电脑的维护。

我部门当时的现状,共有维护人员4个,分工不是很明确, 整体管理比较松散,大家工作没有激情,人浮于事,表面上倒是也过得开心快乐,不过工作中的快乐,没有良好的业绩基础,是不踏实的快乐。但作为一名管理者能够带给下属的理念:应该是高效率快乐的工作,这是人生的真谛,如果能愉快的工作,那样的人生才是高质量的。现在在各种CIO论坛,或者相关的一些文章中,已经很少看到CIO能够对IT维护谈自己的观点了,大家谈得都是安全,战略和业务的融合,如何在业务部门有更多的话语权。最多是说说时髦的ITML,被称作是IT的ISO9000规范。在国内ISO9000已经被搞得面目全非了,想想IT做这个东西能有什么太好的效果。当然个别行业除外,比如完全靠IT支撑业务运维的,如银行,证券、移动、航空等公司。但是对于大多数企业,不能说效果非常明显,实际不用这套方法也完全可以把IT运维做得更好。用了这套方法,虽然比较系统的对各种运维的方法进行了定义,但是总觉得少了点人情味。在中国太缺少人情味的事情,做起来难度很大,这是中国企业的现状,没有办法。

什么是维护工作,简单的说就是保证公司的各类IT设备,能够高效正常的运转。解决这个问题不会有上个ERP系统那样会被宣传有什么给企业带来太大的效益和对战略的支持。上各类管理系统系统已经被各管理咨询公司、软件企业、媒体炒作的如同道家服用仙丹一样的效用。所以维护往往会被人忽视,直到这几年ITML开始流行,出师有名,很多公司借着ITIL的名头,去推广维护的流程和标准化,实际上既然是自己的工作,是否出师有名,都应该努力做好。什么是合格的管理者,很多管理学家或者成功人士都有不同的定义,我认为合格管理者所需要具备的一大品质,就是带领自己的团队不断进取和拥有永不止步的精神,但是这样的管理者在我身边好像越来越少了。很多人都是随遇而安,工作的底线很低,你看他们的工作每年和每年都没有什么变化,不说对不起这样的工作平台,起码对不起自己的人生。

分段1:

做任何事情都会有一个突破口,虽然当时我对于部门改善有很多的想法,但是具体从哪点开始哪?我先进行了一次简单的摸底。即同一个维护人员一起,到各业务部门维护电脑,那天上午他接到4个维护的电话,其中有三个是杀毒。“老人家”曾说过一句话,没有调查就没有发言权,只是一个上午的跟踪,我已经确定了,第一件需要做的事情,就是安装病毒服务器以及客户端。实际集团公司早在2000年已经购买并且部署了Norton软件,不过我们公司没有安装。我希望通过防病毒服务器的安装和部署,组织人员进行一场会战。也想通过这个活动,让大家感觉到我对工作质量的要求,以及对大家需要投入工作激情的要求。

整体安装计划如下:

1. 从总部获取最新的防病毒软件版本。

2. 测试服务端以及客户端各种功能,包括病毒库更新,病毒库下发以及客户端接受管理等功能。

3. 周末部门所有人员,把公司计算机全部安装上客户端软件。

4. 周一上班之后,继续跟踪各部门有关病毒情况。

部门全体人员利用周末的时间加班,在公司范围内安装防病毒软件。无论是做维护还是做开发的,所有人全部参与,有点类似大会战,我喜欢这样的部门内部的跨职能的大会战,可以让部门每个人感觉到部门的各项工作是相关联的,而且部门的工作需要大家跨职能的相互支持和帮助。适当的进行一下类似的会战,有助于调节部门气氛,相互之间了解下工作,也有助于部门人员的发展。

统一管理的病毒软件安装之后,病毒代码首先由公司内部服务器自行从互联网下载,然后客户端启动的时候,自动从公司内部服务器下载最新的病毒代码,并且可以设定每台计算机自动扫描本机的时间,服务器可以对每台客户端的病毒感染情况进行跟踪。可以说公司的病毒情况马上得到了很好控制,而且又通过分析,发现后续病毒情况主要是有上网权限的用户,自己从网上下载一些可执行文件,我们又通过代理对这些用户进行了下载屏蔽,这招真的管用,公司内部的病毒数量,像2008年股票一样,直线下降。到现在为止,5年多的时间,除了因为更新病毒服务器和客户端一次大的调整之外,几乎没怎么受过大的病毒干扰。记得2008年的时候,一位大公司的CIO朋友给我电话,说公司受到了大型的病毒侵扰,整个公司的电脑几乎全部瘫痪,后来请来的病毒公司的专家,进行现场指导和更新公司的病毒库,情况才得以良好的控制。

记得我和我的前任IT Manager说过这样的话,你在这里做了几年的工作,什么都不需要做,你只要做一件事情,就是规范公司的开发语言和数据库,只用同一种语言和数据库,这就可以算作对公司的一个大贡献了。因为你的继承者,可以利用你所做的工作进一步推动新的工作,而不是从0或者负数开始。

作为CIO,最需要做的事情就是为企业的IT做最基础最有效的工作。即便你离开后,公司IT建设也会因为你曾经的工作而得到很好的继承和发展,而不是全部重新梳理。

新到一个公司开展工作,要找一项实施周期短,见效快的项目,把你的工作思路和想法在这个项目中向大家展现。

公司的防病毒体系必须有效的建立,要不然陷入无为的忙碌中。

防病毒服务器的安装,是我在公司维护方面实施的第一个项目,那么接着发生的事情,又让我把维护工作推向了一个新的水平。

防病毒服务器安装没多久,公司张总找到我说,现在大家普遍反映上网慢,看我有没有办法提升一下速度。初看起来是个技术问题,实际是个很典型的管理问题,技术只是实现的手段。只要上过互联网的人员,都会有这样的经验,当上网速度慢的时候,很多时候都是把计算机重新安装或者优化之后,上网速度明显加强,这也是Windows系统的一个主要问题,当计算机运行了一段时间,可能受病毒、所安装软件以及一些垃圾文件的影响,计算机运行速度会有不同程度的减慢,自然会影响上网速度。当然上网速度还有一个主要因素就是网络对外出口的速率问题,这是个硬性指标,增加网络带宽是可以让上网速度增加,但是毕竟是需要投入的,如果没有特殊的需要,公司不会再投入增加带宽。作为IT部门很重要的一个职责就是让公司的计算机保持一个良好的工作状态,最低限度减少因为计算机本身的问题,而使上网速度慢。据此又对公司的电脑有计划的整体进行了优化,主要是以下几个方面:

1. 很多计算机安装之后,使用了几年了都没有重新安装过,造成运行速度很慢,所以根据每台计算机运行情况,进行重新安装。并且重新安装之后再做“克隆”,如果计算机再出现软件的问题,则不用重新安装,直接使用上次的“克隆”文件恢复即可。

2. 规范安装系统方式,在C盘上只安装系统文件和应用软件,数据文件可以放在D盘,克隆的文件,放在另外的盘符。

3. 运行类似于系统优化大师之类的软件,对系统进行优化、整理硬盘碎片。

4. 主动的,有计划的把电脑升级到至少512M的内存,研发部门都是1G以上,升级性价比最高的方式,取得效果最显著的莫过于升级内存。因为公司有10多年使用电脑的历史,很多计算机甚至128M的内存。

5. 维修率居高不下,实际就是对业务的影响率高。所以故障率就是业务人员的办公效率。故障率高,办公人员的效率就低。

经过以上的过程之后,计算机性能、速度得到很大的提升,上网速度自然普遍会快很多,大家使用电脑明显比以前稳定。一个是让用户感觉到信息部的服务质量和意识在提升,同时也让部门的人员感觉到我的工作要求,逐步把他们推向一个正常的工作轨迹。

前两年深圳的很多公司因为限电的原因,而不得不调整上班时间,这也说明电脑在现代办公中已经是个离不开的工具。举个我在新会中集感受的一个最典型的例子,现在的人看起来可能不觉得什么,记得1997年我才到新会中集的时候。当时部门经常会发些通告或者通知,都是由部门的一位同事,先打印通知,然后根据需要分发的数量多少复印若干份,发到各部门相关人员处,每个拿到通知的人需要签字确认。而现在只需要一个邮件搞定,而且速度非常之快。可能现在的同事们早已经忘却了10多年前工作的方法和方式了。因此公司员工的工作对电脑如此之依赖,保证电脑高效稳定运行,是IT部门重要职责。

经过对这两件事情的处理,已经逐步把部门的维护工作逐步推向了正轨,这两件事情的起因都是因为一些问题的处理,所以大家不要怕问题出现,问题到来的时候,恰好是你提升的转机。我个人经历的很多事情都证明的这一点。也就是在某个事情比较低谷的时候,如果把握得当,恰好是迎接下一个波峰到来之前的调整,这一点在股票市场上是最得以验证的。人生也莫不如此。

大概一年左右的时间,逐步把一些基础的工作做好,同时把工作标准和要求通过一些事例进行要求和规范,明确分工和责任,维护工作的改善取得了初步的成效,投诉明显变少,各部门和服务态度质量都有了明显的改善。可以说维护工作基础工作已经完成,做这项工作的人员具备了基本的技能和服务素质。

因为我还有其他工作需要忙,毕竟作为一个IT Manager,不可能只是盯着维护看,还需要关注系统、ERP、开发等等方面的内容,我感到逐步理顺之后,把这项工作的管理交给了一位同事负责。

大概又过了忙碌一年的时间,时间关系没有太关注运维方面的工作,一封投诉邮件又引发了我的思考。

分段2

那天早上才过来,就收到一封来自于研发中心一位同事的邮件,邮件的标题是“希望信息部的工程师脾气同技能是成正比”,典型的投诉邮件。我就赶紧询问我们的那位工程师事情的源由,他说是研发中心的人员搞错了,不是他邮件中所说的那样,计算机出现的问题,他已经很好的解决了,对方可能不太了解,或者说出现了新的问题,以为我们没做好。我说既然是这样,你为什么都不给别人一个正式的答复。他无语。当时我并没有同研发中心的这位同事沟通,但是很明显,我们在进行维护的时候,无论是维护质量还是态度,都令对方非常不满意。后来我又同研发中心的那位同事沟通,的确是我们的工程师同样的问题,处理了好几次,都是在现场的时候好像可以了,但是后来又发现出现了同样的问题,问题解决的不彻底,而且我们维护人员的态度就变得非常不耐烦了。这里附加一句,我们部门所在的办公楼,同研发中心不在同一栋办公楼,来回大概要10多分钟的时间。我代表部门向研发中心的那位工程师道歉。同时也很严厉的批评了我们的维护工程师,而且把这件事情也和大家一起进行了交流,希望大家以此为鉴,不要发生类似的事情。这件事情也引发了我的思考,对于用户的服务,我们还有那些能够做的更好些,或者更加主动些。结合自身的经验,我又想到了另外一个促进运维水平提高的方法,走出去主动维护。记得汉武帝当时同匈奴开战之前,汉朝都是被动防守,结果总是被匈奴骚扰,不得不求和。汉武帝改变了战略,主动出击,甚至攻击到大单于的老窝,结果取得意想不到的效果。最终匈奴节节败退,被赶出草原。也造就了大汉天下几百年的稳定基业。

我对维护工作提出的新的思路和要求,就是走出去,不要坐在办公室等电话,取而代之的每天到各部门巡查。而且根据我们工厂内部地域比较广的情况,把两名维护人员直接派到现场去办公,这样被服务的部门甚至不需要打电话就可以通知我们的维护人员,我们的维护人员也可以第一时间到现场进行处理,这样就减少了不同地点奔波而造成的时间上的滞后,以及以往维护人员怕麻烦的心理,不想走远,那么也降低了这种心理对工作的影响。

从那之后,逐步在部门推广主动维护,就是每天定期到所负责的部门进行巡查。各部门人员知道了我们的巡查规律,除非非常紧急的问题,他们会等到我们到现场的时候,把遇到的问题告知我们,这样我们就可以利用集中的时间,对问题进行集中解决。非常有效的提高解问题的决效率。

因此从这件事情之后,提高主动维护,降低被动维护成为我对维护工作的一个非常重要的要求和工作指导。我认为维护工作的最高境界就是无为而治,维护人员如果每天都很空闲,或者说被动维护为0。当然这种无为背后是主动的有为去支撑。

随着大家生活条件越来越好,大家都是越来越关注自己的健康,养生热在这几年颇为流行,而几本以中医理论为基础的著作在引导着其中的潮流。吴忠源的《人体使用手册》以及中里巴人的《求医不如求己》系列,可以说是其中的代表者。实际这几本书都有一个比较一致的观点就是,在人的一生中,对疾病的预防远远重要与对疾病的治疗,因为有些疾病如果症状已经表现出来之后,很难治疗,并且治疗之后,身体的机能也很难恢复正常。

人如此,计算机的软硬件同样如此。以此为基础,我们全面在维护工作方面推广主动维护方式,比如定期检查所有打印机性能、对机柜定期检查、监控设备的定期检查、外部网络线路设备的定期检查等。根据检查内容不同,检查项目以及检查的周期都有所不同。经过对这些项目的常规性检查,如同人的定期体检一样,可以发现潜伏的或者已经暴露出的一些问题,及时把这些问题解决在影响未表现或者症状比较轻微之时。

在这之后的IT管理工作中,对于维护的主动性,一直是我管理工作的指导思想,当任何一个问题出现具有规律性的时候,我都会和大家一起商量,解决这个问题是否有主动解决的办法。同时进行一些投入产出的评估,如果投入不大,而可以取得的更为积极的预防效果,那么我们就会去执行。比如今年7月份我们出现了6起因连接计算机的网线问题而引起的客户端的故障,那么我们会找专门的网线测试仪,我们之前有过,但是精度不够,现在可以对我们的所有网络线路、网线测试,替换不合格的线路、网线。主动排查网络线路,把网络线路问题解决在未发生之前。

分段3

计算机设备的主题是硬件,上面提及的问题,主要是针对管理问题,那么运维一定离不开硬件。下面就硬件的采购品牌问题,谈谈我们我自己的看法。新会中集购买和使用PC机应该有10几年的历史了,我们购买的电脑主机设备基本上是IBM,少量的DELL,打印机激光的以HP的为主,针式打印机以EPSON的为主,网络交换设备以Cisco为主,有个别的D-Link。在整个硬件维护的过程中,计算机出现问题的概率是最大的电脑主机。在这里我首先还是感谢我们的张总。他从公司开始大批量购置电脑的时候,就要求我们只购买IBM品牌,中间也买过一些DELL的,但是从最终维护的结果来看,还是IBM的计算机好用,相对维修率低很多,而且服务商单一,有问题找蓝色快车就可以。对于一个大型企业,给大家一个好的建议,买电脑选定1到2个大的品牌,品牌相对单一,品牌少一些,忠诚一些,时间长会给你回报的。千万不要贪图一时的便宜,对日后的电脑维护升级工作带来麻烦,这个也是非常重要的基础。现在不少的公司,都是现在市场上什么便宜就买什么,过不了几年,公司的电脑可以说是几年的电脑历史博物馆了,出现问题维护、升级等都很不方便,而且无形中会增加不少的相关成本,同时因为电脑不能及时维修而对具体的业务产生影响。我是碰到不少的总经理,从投资角度考虑喜欢购买市场比较便宜的,实际上也购买了更大的风险。我上边提过,电脑故障率提升同时代表着业务人员的办公效率的下降。我认识一个CIO朋友,也是国内很有影响的大企业,很雷人,竟然公司的几乎所有电脑都是自己组装的兼容机。去了他们办公室一看,简直像个电脑公司的维修室。各种备件的盒子花花绿绿满屋都是,电脑200台左右有5个兄弟专门负责维护,几年前买的那些品牌和备件可能现在已经不存在或者驱动程序已经很少有了,给管理带来很大的麻烦。实际上没节约什么费用,这样的配置,很难把维修率降低。所以降低维护率要从综合几个方面去考虑。

在硬件方面出了能够带来降低设备故障率的帮助,除了上边谈到的品牌问题之外,还有一个这几年开始普遍使用的,就是终端的使用,或者有的叫做嵌入式系统。所谓终端就是用户的数据都存在服务器上,本机只是作为显示接收信息,真正的处理都是在服务器端。终端使用由来已久,几十年前,PC机器尚未普及,当时后台的服务器都是小型、中型或者大型机。前台用户使用的就是终端,这几十年随着PC的普及,终端的使用逐步被大部分用户抛弃。因为支撑终端服务器的价格,造成了使用终端的成本非常之高。现在PC服务器的处理能力也增强了很多,因此这几年终端的使用开始又有普及的趋势。

2007年一个供应商到我们这里推广终端,听了他们的介绍,感觉还是挺好,但是现在IT供应商都比较能忽悠,我们建议最好供应商代我们去看一个成功案例。供应商带我们去了广州万宝去参观学习,他们当时的终端用户有几百台,使用效果非常不错,这样基本打消了我们的怀疑态度。刚开始我们使用一台比较旧的服务器,抱着试着看的想法,开始是几个用户试用。在试用过程中,病毒服务器的配置、Office设置,打印机配置,CAD配置,使用ERP系统等都进行了测试和研究。同时供应商在技术方面都给与我们很大的支持。让我们在技术支持能力以及使用效果上,有了进一步的信心。后来随着用户数量的增加,就购买了一台新的服务器服务器,开始我们认为服务器的瓶颈可能在内存和CPU。当时购买的服务器的配置是四核CPU,4G内存的配置,但是用户量大的时候大家还是反映慢,我们猜测可能I/O处理是服务器处理的瓶颈。我们又购买了一台硬盘是SAS硬盘的服务器,配置了RAID1,基本上用户就没什么不好的反应了。经过了一年多的推广,到现在我们终端用户已经占了我们总体用户的40%,近百台。这些用户的维护原则上就是零维护。我们工作的重点是把服务器的备份,防病毒等工作做好。只面向一台服务器工作的难度和工作量,远远小于面向上百台pc机的维护。当用户出现问题的时候,我们换台终端或者让它使用其他闲置的终端就可以。这样好的方式当然不能独乐。我们也向集团的其他兄弟单位或者关系比较好的朋友推荐,很多到我们这里看过我们的终端使用情况,基本上回去都会去部署。现在除了研发,营销,财务,等部门,其他部门如果有新的人员或者旧的电脑损坏,我们都会配置终端。

经过2年多的使用,我总结了使用终端具有以下优点:

1、 终端是绿色产品,终端机器本身的设计非常简单,只是一块电路板,耗电非常低,只有20瓦左右。是一台pc机的十分之一。按照每天计算机使用10个小时计算,这样一台终端机器每年节约300度电。既节约了费用同时是绿色和环保的。现在PC的价格很低,在我所管辖的下属公司中,当我们推广终端的时候,一位企业的老总就提出这样的问题,终端价格和PC相差不大,为什么要买终端,实际上一台设备的成本除了购买的价格之外,还有使用的成本,以前使用计算机大家都对这部分成本忽略不计的。这样算一下账,终端的使用成本非常低,无论是在电费上还是维护成本上,以及因出现故障而对业务的影响上。

2、 故障率原则上是0,终端本身的硬件结构使之出现故障的概率也很低。因此备份几台终端机器,当用户出现问题马上把备份的机器给用户使用。不会像PC机器那么多的软硬件的故障,而且故障解决需要花费一定的时间。

3、 提高旧计算机的利用效率高。我公司有部分购买年限比较长的电脑,扩容性很差,无论是内存还是硬盘。同时电脑业没有坏,扔掉了可惜,但是使用起来效率很低。不过有了终端服务器之后,可以把旧电脑,模拟成终端使用,这样可以有效地提高设备的利用率。

4、 可以对公司用户的数据进行统一管理。因为用户的数据都统一存放在服务器上,因此对用户数据的统一备份和管理就非常方便,在某些特定的公司,这一点不是非常重要,而是相当的重要。

因此建议没有使用终端的朋友们,可以尝试在贵公司推广。当然我说的终端这么多的好处,有没有缺点,我想了半天,没想出来,不过有一个管理重点到需要重点提到。因为所有用户的配置以及用户文件都是存放在服务器上,因此服务器的备份和管理就显得异常重要,我们开始的终端服务器使用的是,已经服役了4年多的服务器。中间就出现过数据的异常,很多用户的数据出现问题,幸亏我们及时作了用户数据的备份。才没有出现大的问题。回来随着用户数量的增加,我们购买了新的服务器,类似的故障基本没有出现。使用终端在用户端的投入少了,但是一定要加大对服务器端的投入,包括硬件要高配置,以及对服务器的备份和加强管理。可以采用双机热备之类可靠性比较高的方案,提高可靠性,类似的方案现在市场已经非常成熟,并且价钱不是很高。我们集团有一个兄弟工厂,用了4台服务器作为服务器,他们宣称公司所有用户,包括技术部的用户都可以全部使用四台服务器,速度很快。

也说了那么多了,把维护方面的工作,进行些总结。

1. 加强主动维护,每天主动到用户那里去。不是坐在办公室等电话。

2. 对于PC,则尽量采用品牌机器,不要太多的品牌,那么给你维修的时候,会让IT人员花费更多的精力去联系不同的人。其他设备,如网络设备、打印机等也尽量购买品质比较好的产品。

3. 构建公司防病毒体系。留心最近新病毒对公司的影响和扩散程度,以便及时更新病毒代码,甚至下载专用杀毒程序。

4. 给公司电脑构建合理的Ghost文件,定期给电脑做软件更新或者维护。

5. 对于其他外部设备和网络设备,比如室外的网络线路、机柜内设备、外部监控设备,也必须要实现定期监管的方式。因为这些设备有时候处于长期不被关注状态,而且出现问题对于问题点,很难寻找。

6. 使用终端,以降低设备维护频率,把维护人员解脱出来。

不妨试试以上几点,绝对可以有效的降低您公司的设备故障率以及被动维护率,提高用户对IT部门的满意度。这些方法或者方式也并不是什么大家想不到的方法,关键在于这些管理方式的执行和落实。落实到位了,自然效果就会有所体现。如果只是泛泛而为之,是不会取得真正的效果。

说的差不多了,该说说金融危机了,2008年的金融危机,是我们这一代人真正感受到的大冲击,中国已经是全球供应链非常重要的一个环节,当世界范围的经济出现问题的时候,中国独善其身已经不可能了。

分段4

这次金融危机对我们的企业可谓影响巨大,人员大量的流失,我们部门也一样,由原来的维护人员4人,变为1人,当然用户数量也极大地减少了。但是一个人面对大量维护的时候,有些问题的解决可能比较匆忙,不够彻底。慢慢有些用户就会有些抱怨,主要就是一次维护完成率不高,时间一长这些抱怨比较大,反映到了我们的张总那里,张总因为这个事情也比较严厉的批评了我。面对这样的问题,我采取了积极应对的措施,其中最重要的一点就是建立了运维管理信息系统,当用户出现电脑设备方面故障的时候,以前是直接给我们打电话,现在是在系统中提交故障描述,如果电脑出现故障无法登陆我们的运维管理信息系统,可以使用其他人的电脑填写保障单。当然如果比较紧急的问题,还是可以打电话给我们的维护人员。我们的维护人员根据大家填报的情况到现场进行维护工作,然后将问题进行分类,并且填写维修方法。然后每个月根据维修记录情况,做本月的维修情况分析,发报告给全体人员。整个系统的运作比较顺利,基本没有出现用户不愿意填写单据的情况,经过2个星期的推广,已经在全公司范围内开始推广使用了。使用了这个系统有几个好处。

1, 可以实现同用户的互动。大家看演唱会每个歌手都喜欢煽动观众的热情,靠的就是主动同观众互动的方法,实际管理和服务互动同样重要,只有同用户互动加强,才能真正了解用户的需求和加强我们的服务。以前只是用户同维修人员之间的一对一的互动,现在通过数据库系统,他们可以把的意见写在他们维护系统中。多提供了一种比较方便反馈大家意见的途径。

2, 可以有效地反应我们维护的效率和质量,出现一个问题是多久维修好的,返修率是否高。以前是凭感觉,现在是靠数据说话。这样也促使维护人员很认真的对待每次维护,高质高效的完成。

3, 通过对数据的分析,可以总结出有规律出现的问题,进行主动的维护,比如我们使用运维管理信息系统2个月之后,发现打印机的维修率比较高,而且都是用户比较急得时候,出问题,比如打印工资条,我们公司几千人,打印起来需要时间还是比较长的。大家都比较匆忙和被动,所以我们绝对每个月对所有打印机进行一次巡查,发现些简单的问题,我们先进行处理。效果很好,第二个月故障率明显降低。

现在这个系统已经运行了半年了,积累了大量的第一手的维护资料,这些信息对于我们未来维护工作的提升,都提供了宝贵的资料。可以说受益无穷。如果有条件上信息运维管理系统的朋友,还是建议大家使用,会对你的工作带来意想不到的效果。

下面讲一下远程维护的话题。因为现在集团企业在中国是非常的普遍,我们公司各个分公司也是遍布在全国各地,东到江浙皖,北到内蒙海拉尔,由于公司对信息化建设的重视,每个公司都安装了专线,原来是DDN现在都升级成为电信的VPN方式,非常稳定。就是费用贵了点,每年一个工厂的通讯费用大概是接近10万。所以如果有了专线,远程维护就相对比较简单,而且他们本地基本上没有什么服务器,在以后的章节中,我会给大家做介绍,关于集团企业公司的IT管理。前段时间一家公司叫做NTR的公司,给我演示了如何通过互联网,进行远程维护的做法,真的方便,只要两台计算机可以上网,登陆到指定网页,就可以由一台电脑对另外一台电脑进行操作,而且速度很快,这种方式对于经常出差在外的,或者有的公司专线不稳定等非常有帮助。比如我们在放假期间,可能只有一个人在值班,但是当服务器、或者某些特定系统出现问题的时候,只有部门的系统管理员才能解决,我们以前都是用QQ的远程桌面功能,在这里感谢腾讯公司给我们免费体验,不过便宜好货不多,速度太慢了。如果你连接的时候想小便建议你马上就去,要不你用QQ的远程桌面连接,解决问题之后,基本上你的前列腺已经肿大到了《疯狂的石头》里边的周涛的那个程度。

其他的关于管理信息系统维护,比如ERP系统,PDM,HR系统等,我在以后的章节,结合各系统的特点会有比较详细的介绍。在这里都不多啰嗦了。

各个公司的管理重点非常不同,有的公司对于保密非常看重,记得在2000年的时候,本人应聘一家港资公司的信息总监,当时老板亲自问我一个问题,就是如何让他们的研发人员既可以上网查询资料,又同时防止内部把资料传到外边。可见各个公司对于维护都有各自的理解,太具体的东西我不见得会写得很全,但是我会把我认为重要的一些维护方面的原则进行描述,希望能够对广大的IT主管或者CIO有所帮助。希望大家拍砖。

也写得差不多了,最后再谈一下,维护人员的心态和态度问题。米卢说过,“态度决定一切”,实际对于维护工作来说,尤其如此。IT维护核心的性质就是服务,如果想让用户满意,必须能够让用户感觉到你永远就在他的身边,随时为他解决问题。达到这一点首先需要CIO或者直接主管的相关领导需要具备这样的意识,然后才能让具体的维护人员有所感觉,并且在实践中,把这种思想传递给最终的用户。

所以说真正能做好IT运维的人,不是每个人都合适,技能正常只要努力的人基本上都可以达到,实际最难的还是这种服务意识和态度。有的人天生服务意识就差,即使你给他再多的压力和考评,他总是很难达到最终所需要的态度和工作效果。实际大家没感觉到吗?改变一个人是很难的。而且人在企业做久了,他会有惰性,对于那些比他晚来的平级的员工,他很难有那么真诚和到位的服务。上面谈到的很多都是管理和硬件方面的,那么用心服务就是软件。作为管理者要重视,而且要身体力行,让下边人感觉到你对这个工作的重视程度和标准。给用户以专业的服务,如果能做到这一点,已经是非常之难了。所以说管理既是科学也是艺术,上面谈到的一些,任何公司只要条件具备都能做到,用心服务这点,需要花更多的时间和精力去经营。实际何止IT维护这部分工作,任何工作又何尝不是,工作激情和热情,或者薪水职务的刺激,不能再刺激你之后,靠的就是职业化的要求了,或者是对自己的要求。

能做到了这一点,可以说是维护中的上乘之作了,做好每件小事情,一样可以成就大事业。这就是所谓的“一生二,二生三,三生万物”。

第一章完。