探索中国CIO人才现状 | 第四季调研报告
其实,网络也没那么慢
2015-07-29  来源:techtarget

本期访谈中,我们请到了ABB北美分公司网络基础架构经理Michael J. Kerkau。ABB是一家总部位于瑞士的机器人设计与制造公司。

Kerkau负责公司在美国与加拿大30,000名用户的网络运营。当用户抱怨一个应用程序因为网速慢而卡顿时,Kerkau则负责分析其真实原因。

您最近的主要工作是什么?

Kerkau:ABB正处于一种持续扩张的状态。我们在争取业务方面积极进取,帮助全世界客户完成产品与服务的整体交付。作为增长过程的一部分,我们需要将各种不同的网络整合到ABB企业网络中。许多案例都不是完全整合;关键是让不同的网络协同工作,使不同环境的用户能够访问他们所需要的资源。

我还发现,我们在使用Riverbed的SteelCentral平台优化应用性能管理上花了很多时间。以前使用其他老技术时,用户会指着自己的机器或服务器,然后说:“问题肯定出在服务器上。”现在只要出现了性能下降或用户不满意问题,自然的反应通常都是网络出现了问题。结果所有应用性能问题都跑到我这里来了。因此,现在我许多时间都用在确定哪些应用性能是与网络无关的。

比起以前拨号上网的时代,我们现在的网络连接比以前稳定得多。过去判断网络问题通常都是正确的,因为其中涉及很多不同的变量。现在网络通常已经不是问题的根源,大多数情况是其他问题引起性能问题,如服务器或应用程序本身的限制因素。

你说的应用程序限制因素是指什么?

Kerkau:有很多时候,我们不得不重要造轮子,才能让产品在新技术环境中正常工作。因此,我们在内部开发了许多的应用程序,其中有一些已经年代久远。我们开发了电源分配单元和电力变压器,它们会部署在邻近区域、商业中心或医院中,这些设备会独立运行二十多年甚至五十多年,在此期间它们完全没有任何变化。

我们需要维护一些支持这些设备的应用程序,而它们早就过了维护寿命,它们有可能迁移到更新的应用平台性能会更好,但是要给15年前生产的设备移植现代新技术,这简直是一种不可能完成的任务。因此,我们必须维护这些本身不是针对现代基础架构设计的应用程序。例如,我们发现有一些应用程序在流程中设计了延迟时间,以补偿服务器上可能出现的延迟。原始服务器无法足够快速地返回程序中下一步骤所需要的正确数据。现在,人们期望点击之后新页面马上显示出来,而这些应用程序的速度达不到这种期望值。因此,他们会先入为主地认为是网络问题,然后当我们深入分析之后,才发现问题是这些老程序还不适应新环境。

你的软件背景或其他技能对于诊断这些问题是否有帮助?

Kerkau:没有,我完全不懂应用程序。我的专业仅仅是支持客户系统。事实上,我曾经临时借调去担任了三个月一线网络工作职位,现在换了一个经过专业网络培训的技术人员。我甚至没有参加过网络培训,所以我只是在实践中探索出来的——大多数实践都是故障修复。

!你借调到这个职位有多长时间?

Kerkau:这是我工作的第三年。

这是一段非常长的时间了。

Kerkau:嗯,确如此。我已经变成事实上的网络人员了,但是我肯定还会利用其他资源。我属于北美的网络管理团队。按照我们面对的意外情况,我的团队已经被认为是必不可少的,但是最重要的是我。对于网络,可以说我的作用就像是手机电池。

你能否谈谈你所使用的Riverbed产品?

Kerkau:早在它们被Riverbed收购之前,我们就开始使用Riverbed Professional Management Services(专业管理服务),它们当时叫OPNET。我们当时之所以购买这些产品,是因为我们需要从美国康涅狄格州温莎市的一个数据中心迁移到北卡罗来纳州罗利的IBM数据中心。我们需要知道迁移之后这些应用程序在新结构中的性能表现,以及它在新旧数据中心的具体性能差别。在我们完成了迁移之后,我们就在遇到性能问题时使用OPNET创建一个响应服务。

我们还使用Riverbed的SteelCentral transaction Analyzer,在用户抱怨性能问题的客户机上安装一个代理程序,然后它会跟踪从客户输入数据到点击后通过网络发送到服务器的应用程序交互全过程。

我们也尝试实现了一些仪表板,在这一点上我们实际上并没有成功。它一直不是我们关注的重点,因为我们在持续关注这些应用性能问题。但是,它们的价值是使我们能够通过少数Web界面来确定应用程序的性能是否和以前一样好。

为什么创建它们的难度这么大呢?

Kerkau:主要问题在于设定优先级。我们还无法投入足够的资源和时间去创建和运行这样的仪表板。但是,这其中有一部分属于技术原因。例如,在创建仪表板以获得精准反馈的过程中,我们遇到的一个限制因素是因为我们在北美有多达900个子网。显然,仪表板应用程序需要定期采集大量的数据,才能展现出有意义的数据。

你的公司确实有许多重量级工程。这对于网络而言意味着什么?

Kerkau:我们单单在美国和加拿大就有100个站点。它们持续共享着工程数据,实际上3-D CAD就一直是我们的挑战。例如,如果我们的一个合作提供商修改了他们的组件,那么就可能产生一些后果——不仅仅物理修改会迫使我们重新设计一些邻近组件,而且也能够需要修改电压或其他完全不相关的东西。

组件制造商可能会打开3-D CAD制图并作相应的修改。然后,通常情况下负责这些组件的团队会提醒图纸有改动。接着,他们就不得不打开相同的3-D设计图纸,然后作相同的修改,这会像滚雪球效应一样影响其他的组件,它们都需要进行相应的修改。所有这些都会涉及大量的GB级3-D图纸文件。

因此,将一个3-D大图纸文件传输到整个北美是一种挑战,而且让所有人处理这些不同的组件也是一种挑战,而且有时候还要求同时处理。老实说,我们并没有太多地关注于这个方面。

很多人都会问一个问题:你是如何进入IT行业的?

Kerkau:我一开始在美国海事公司工作。我参加一些特种情报培训——与技术完全无关。实际上,我的主要工作是收集摩尔斯代码,然后执行情报分析。我在海事公司工作了近7年时间,然后退役后我进入了待岗状态。大概在98或99年,他们不再需要特种情报,然后问我是否愿意再接受新的培训。我接受了,当时需要IT专业人员。

我再次接受了培训,然后Y2K出现了。当时,我已经是一位海军中士——相当于中层经理,然后我承担了技术支持经理职位。我按照北美的一个重要指令负责完成Y2K迁移。之后,我在2000年受雇成为ABB一名临时员工,职位是技术支持专员。

由于我有计算机知识和情报工作背景,我开始处理一些内部调查,从计算机角度给他们提供一些支持,这是他们以前从未尝试调查过的一个组件。虽然我与ABB的调查专员一起工作,但是我向他们解释说,如果我们在公司中建立一个计算机分析规则,那么工作会更高效。我帮助完成了基础工作,我们创建了一个特殊调查计算机分析单元。这是ABB的第一次,然后我返回ABB负责掌管这个部门。

这个部门仍然继续存在,而且规模扩大了很多。但是,当时我返回了北美IS管理团队担任了项目经理、意外事件响应经理和部门服务经理。然后,正如我前面提过的,我借调进入了网络管理岗位,他们把我调去填补了几个月空缺,然后我返回了最初的工作岗位。