探索中国CIO人才现状 | 第四季调研报告
APM策略:关注用户体验,而非IT指标
2015-11-25  来源:techtarget

对于存在的问题,Tom Cabanski的团队已经开始行动。

Tom Cabanski是百叶窗在线销售商Blinds.com的软件开发总监,其团队通过New Relic应用性能管理软件,发现公司网站对用户预订免费样品的需求反应太慢。Cabanski知道,该项业务对客户转化率非常重要,因此带领团队迅速修正了这个问题(仅仅是一小段代码的修改而已)。

“当我们收到性能告警之后,意识到了这对用户体验所带来的伤害。”Cabanski表示。

据Cabanski表示,过去,情况并不是这样的。Blinds.com之前在应用性能管理方面主要专注于IT的指标上,而不是应用提供给用户的真正体验。

这种思路导致IT员工被纠缠在那些并非核心问题的事项上,或者干脆忽略了相关告警。

在Cabanski革新APM策略之前,对于用户感到样品订购服务较慢的问题,工程师们可能只会收到磁盘剩余空间过低或服务器发生阻塞情况之类的告警 – 而不是关于响应时间过长的告警。

“现在,我们能够在问题变得严重之前准确定位并采取相应行动。”Cabanski说:“站在我们的角度来讲,APM工具对提升企业竞争力非常关键。”

尽管Blinds.com仍旧在使用诸如磁盘可用空间等传统的指标,其APM策略已将主要关注点径直瞄准了用户的体验方面。

“APP经济”下的APM策略

当前,多数分析师认为,如果企业要保持竞争力,必须将APM的关注点调整到与用户体验和企业价值直接相关的指标上。

“APM不再仅仅是对基础架构的维护,更是业务的关键。”Forrester分析师Milan Hanson表示。

实际上,如今的绝大部分企业,都需要通过应用直接和用户、合作伙伴和员工进行交互。因此,应用性能就变得无比重要。而且,随着“应用经济”时代的到来,这一点尤为凸显。尽管已经成为企业级别的战略,很多公司在应用性能管理方面的步伐仍然滞后,亟需革新。

“大多数传统的IT部门未能跟上形势,他们仍在使用传统的指标来评估服务,而且是在分裂隔离的状态下各自为政。”Gartner分析师Federico De Silva表示。传统的企业应用环境已经演化的极其复杂,以致于很多CIO无暇将主要精力放在APM上。

De Silva认为,这并不意味着维持现状是一个可选项。

De Silva表示,企业应该放弃通过监控基础架构来评估应用性能的做法,转而“从用户的角度”进行管理。这是因为,从员工和客户的角度出发,他们希望的是企业的应用生态(包括云平台、移动应用和内部系统等)能够与通过苹果和安卓设备所获取到的那些优秀应用并无二致。

根据De Silva的看法,对APM管理的第一步,首先是CIO们要真正了解自身的应用环境、希望到达的性能标准以及评测相应指标的工具(比如,根据设备类型和地理位置对应用响应时间指标的细化)。

不要为树木而错过整片森林

对很多CIO而言,由于IT基础架构的复杂性以及APM工具的缺乏,想要在应用经济下改造传统的APM策略并非易事。

Alexander Pluim是BVA Auctions的首席技术官,对于APM实践的难度深有体会。正如在Blinds.com发生的一样,Pluim的团队一直致力于监控IT的指标,而现在则开始转向以用户体验为出发点。

“目前,我们已经从原来对技术的关注,转向为对用户的关注——关心用户的平台的体验,并将这些体验与服务器或数据库等技术事项建立直接关联。”Pluim如是描述其团队的转型。

举例来说,Pluim的团队过去可能会因为某次数据库查询响应的缓慢而开始找原因,即便这实际并未对用户体验有任何影响。或者,其团队在具体问题(比如数据库性能)的排查上花了很多时间和精力,结果往往是以为已经解决了问题,但用户在访问应用时依然不尽如人意。

Forrester Research的Hanson认为,这些例子都表明,尽管APM存在已久,但是其早就落后于企业的真实需求了。

“基础架构已经演变得太过复杂,我们不止要监控桌面,还要兼顾服务器和网络。同时,还有一大堆应用在运行,其中很多是多组件的,一部分跑在企业内部,而另一部分则由于运行在其他地方而不得不进行实时监控。”Hanson分析到。除此之外,对安全性的监控和管理也是APM的一个组成部分。

“尽管力求面面俱到,你仍旧会接到用户的投诉和抱怨。对此,CIO们有这样的疑惑:‘为什么我不知道这些情况?为什么我看到的是一切正常,而用户一端则依旧存在各种问题?’”Hanson说:“你会发现自己置身于这样一种情况中,对基础架构的监控足够细致,但是依然无法掌握事情的全貌。你无法准确判断哪些问题是严重的,而哪些问题是普通级别的。”

书面化、正规化以及新兴的工具

Andrew Spencer是在线零售商Stance Socks的技术总监,认为健壮的APM策略对于成功无比重要,尤其是对于Stance Socks这种采用单页面应用的企业来说更是如此。

Spencer表示,一个健壮的策略,必须要实现正规化。

“必须要正式记录在案,这是你要考虑的首要步骤。”Spencer说。这意味着,当你上线新应用时,你会明确知道监控的方法,从而能够对用户体验有清晰的认知,最终也能做到对应该采用哪些评测指标成竹在胸。

“APM应该成为应用开发最佳实践的一部分。”Spencer表示。他采用了BlazeMeter(用于负载测试)和New Relic作为APM评测的工具。

Pluim同时强调,选用适当工具做正确事情的重要性。他认为其过去APM管理的问题,部分源于所选用的工具本身,这些工具在提供技术类性能指标方面非常优秀(比如,数据库实时用量的分析和显示),但是没有对实际应用性能的影响作出刻画。2015年初,为了更好地监测应用性能并构建用户体验指标体系,Pluim采用了Dynatrace的APM技术。

通过KPI和DevOps提升APM水平

Gartner的De Silva认为,另一个APM最佳实践是对应用的重要性进行排序。也就是说,哪些应用最终能带来真正的效益。通过这种方法,IT团队能够把握问题的优先级。

Hanson补充说:“这是很多CIO成功的关键,能够理解应用对企业和客户的影响,从而形成对应用重要性的正确把握,并有条不紊地安排工作。”

那些优秀的CIO,同样知道如何运用性能管理战略来提升应用体验,而不仅仅是对问题做暂时、短期的修正。

Spencer在Stance的举措可以为例。“由于对关键性能指标的持续监测,我们能够了解真正影响用户体验的因素,进而确保能够获得重要数据、改进应用并持续提升用户体验。”Spencer说。

De Silva表示,部署DevOps环境也对提升APM水平有重要意义。从其本质而言,DevOps是将开发和运维结合在一起,并与实际的应用场景相契合。因此,DevOps中所监测的指标也正是业务端所关注的。

Pluim表示,在BVA Auctions,DevOps已被证明是提升APM实践的关键因素。BVA Auctions在两年前部署了DevOps环境,以此打破企业内部的藩篱并促进团队间的协作。同时,DevOps也帮助Pluim构建了以用户为中心的APM策略。

“从前,如果应用出了问题,没有人会认为这是自己的责任。现在,所有人都急于让故障的应用恢复正常。”Pluim说:“对我们来说,也从之前基于技术角度修正应用中的错误,转变为从业务的视角去审视并解决问题。”