墨菲定律(如果有两种或两种以上的方式去做某件事情,而其中一种选择方式将导致灾难,则必定有人会做出这种选择。)是一种心理学效应,主要内容是:如果事情有变坏的可能,不管这种可能性有多小,它总会发生。墨菲定律起源于1949年加利福尼亚的爱德华兹空军基地。从那时候起它就成为IT界广泛引用的口头禅。这个定律的命名来自于美国空军的一位上尉工程师爱德华·A·墨菲,他参与的一个项目是为了测试人类瞬间加速度的承受力。根据传说,墨菲上尉在试验中因仪器失灵而发生了事故。他抱怨承担责任的技术人员,说,“如果有任何做错的地方,他就会找到。”
从那时候起墨菲定律似乎频繁发生在技术领域,所有IT人都应该在他们的锦囊中有一些墨菲应对机制。下面就是墨菲定律在IT故障中的现代化呈现方式——以及针对你如何解决故障的建议。
1、你的PowerPoint演示出现鼓掌
最精锐的公司都以PowerPoint演示的方式呈现他们的产品和战略,但是却会遇到演示技术发生故障。如果你是CIO,而你正在向总监们演示IT战略(以及预算需求)时,发生这样的鼓掌是非常令人尴尬的。对于折中特别的墨菲情况,要始终确保人手一套演示文稿。这样演示就可以进行下去,你的听众(从他们一方来说可能是受害者)将会表现出同情之心。
2、一个重大项目取决于某一个贡献者……而他感冒了
这可能是一种很困难的墨菲场景,但是你可以让这种情况不那么困难,坚持对项目进行文档记录(这将让其他人让容易接手),一个可靠的负责人和高技能的外部顾问,让你可以在需要的时候叫他们来。此外,一定要确保在你所有项目计划中包含应急计划,以便你可以找到关键人(以及如果他们不在的时候你应该怎么做)以及关键任务路径。
3、有人加载了错误的软件补丁或者发布版本,系统出现故障了
你认为你的软件管理技术是没问题的……但是“墨菲”却加载了错误的软件补丁或者发布版本,让系统崩溃,证明你是错的。处理这种情况的最佳方式就是立即联系你的用户,提醒他们发生了技术故障,收回错误的补丁或者版本发布,重新加载正确的。以后的审查以评估错误的是如何发生的,以及未来你该如何改进要遵循的流程。
4、数据中心
你不是住在多洪灾的地方,可能每年只有10英寸的雨水——但是不知怎的“墨菲”决定了让洪水在意想不到的雨季淹没了你的数据中心——或者大水是源自于内部冷却或者管道系统发生故障所导致。这时候就需要一个强大的灾难恢复和故障转移计划。如果你可以立即将数据中心的运转切换到另一个数据中心,甚至是切换到一个云数据中心,这将好于你把所有鸡蛋都放在一个数据中心的篮子里面。
5、关键业务的最大客户离开了
当说到IT服务的时候,要应对采购部门总是一场艰苦的战斗,但是只要用户要求的“弗雷迪”在那里,你就可以推动新的IT计划。现在“弗雷迪”告诉你,他的彩票中奖了,他打算搬到毛伊岛去。你面前是一条充满了不合作甚至是怀有敌意的(没有弗雷迪在的)艰苦道路。
最好的办法是立即与部门经理联系,最好是在某种比较轻松的场合以午餐的形式见面。你们俩应该面对探讨过去一直困扰你的问题,找出你们俩都可以接受的新的工作关系。
6、你测试了一个软件套件中的所有应用,唯独那个很少使用的应用——让给系统带来了灾难性的打击
除非所有应用和子程序都经过了彻底的测试,否则应用套件是不能投入生产环境的。但是当最后期限到来的时候,项目经理知道要决定“放行”哪些应用以满足不可改变的期限。他们通过一个应用可能被使用的频率来权衡风险,从而做出决定。如果答案是“很少”或者“可能从不使用”,那么他们可能会选择跳过对这个应用进行彻底检查,以满足最后期限。
这时候“墨菲”来了,一位最终用户使用了这个应用,应用发生故障,让整个系统崩溃。避免这种情况的最佳方式就是要求重新调整应用交付日期,以便进行彻底测试。如果你的最终用户完全拒绝考虑修改日期,或者如果有业务环境是不可动摇的,让你别无选择,那么要提醒离利益相关者和用户可能会发生这种情况,这样他们可以避免使用这款应用直到你有机会完成测试。甚至有一个更好的做法,就是把这个应用从最初部署中去掉,等到为投入生产环境做好准备的时候再添加进去。
7、你的供应商被你的前(敌对)供应商收购了
这是更换IT供应商的痛苦之处。也正是你为什么要试图避免更换供应商除非定价或者技术方面发生重大变化——或者与供应商的关系变得如此激烈让你不再想与他们合作。当后一种情况发生的时候,你会在市场中寻找一家新的供应商。不幸的是,如果一两年之后“墨菲”出现了,新的供应商被你的前供应商收购,你的公司再次陷入窘境。
在这种情况下保护你自己的最好方法就是在你与新供应商的合同中写入“管理变更”条款。该条款要指出,如果在供应商一方发生管理变更(例如供应商被收购)。你有终止合约的权利。
8、你的关键供应商负责人离开了
这个墨菲定律总会发生的一种情况。一家公司要出售新的IT产品。好的一方面是该供应商负责给公司上新的解决方案的负责人是友好且具有一定知识水平的。不幸的是,正当要执行完成的时候,这个负责人被新的负责人取代了,后者既不具备知识又不怎么有帮助作用。尤其是如果你开始进入一个新的IT领域,在你的供应商那里和一个既懂知识又有友好响应的负责人建立紧密关系是非常关键的。你可以在与该供应商的合同中明确规定你有权批准或者接受任何负责人任命/变更,避免被移交给一个较小的负责人。
9、对在线营销活动的响应高出你的想象
你的营销经理惊讶于你正在线上推广的商品被快速卖掉。事实上,订单处理系统中新的订单交易数字是空前的。不幸的是,你是根据历史使用数据在今年的预算下部署处理、库存和通信资源的规模。你的客户也看到了这一点,他们正在放弃交易因为系统无法跟上。唉,营销活动正在演变成一个“墨菲”噩梦。你如何避免这种情况?
为好消息准备额外的资源,方式之一就是从云供应商那里获得额外的计算、存储和通信资源。你可以根据需求购买这些资源,为营销推动的收入增长中支付费用,然后在销售需求过去之后释放资源。
10、你的云供应商也发生了故障
你将主要的系统托管到一家云供应商那里,因为这家供应商拥有可靠和同类最佳的声誉——然后这家供应商发生了故障,使得你所有的客户离线,对公司业务造成可怕的影响。你可以与不止一家云供应商建立管理,这样如果一家供应商出现故障的时候,就可以切换到另一家,从而赶走“墨菲”。另外,尽量避免与他们自己本身不拥有数据中心的云供应商签订IT协议。因为你与你的供应商正在使用的第三方数据中心供应商之间是没有合约关系的。