探索中国CIO人才现状 | 第四季调研报告
微软CTO谈智能时代的企业数字化转型
2019-04-19  来源:CIO发展中心

前言:未来就在眼前,人工智能的时代已经到来,企业数字化转型将是全方位的转型。本文通过采访微软(中国)有限公司首席技术官徐明强,谈微软如何定义数字化转型,并利用领先的技术和成熟的商业生态,予力更多企业完成数字化转型。

徐明强封面.jpg

微软(中国)有限公司首席技术官 徐明强

我们现在经常提及数字化转型,但其实数字化转型并没有一个明确的定义,今天,就想和大家分享一下微软是如何定义数字化转型的。在定义之前,首先需要明确IT时代和智能时代的区别:

在IT时代,英特尔借助摩尔定律一代又一代的驱动了计算能力的增加,而微软实现了盖茨的愿景——每家都有PC。经济学家认为,IT时代大的特点是计算能力的价格的下降,这意味着生产力的变革。“码农”把业务问题通过编程和编译器变成了计算问题。

而智能时代或说数字化时代,在经济学家看来,是因为计算机算力的加强、数据的增多、算法增加等种种原因,造成现在预测能力的价格变低。如今,所有问题都变成了预测能力,如企业业务中的AI洞见,阿尔法狗预测每一步下完后的胜率是多少,同样,计算机视觉、语言、翻译也变成预测了的问题。

w1.png

那么知道IT时代与智能时代的主要区别后,我们要如何看待企业的数字化转型呢?

首先必须要做好数字化闭环,这基于四个支柱: 密切客户沟通、赋能员工、优化运营、转型产品。最关键的是外环的圈,这意味着数据的连通:各种各样的信号从各种源传输过来,如客户传来的信号、产品从物联网传来的信号、企业员工的信号、后端运维数据传来的信号等等,如果数据没有打通的话,业务中的问题就很难回答。

列举一个最常见的例子:制造业的老总问,最近发出的产品中哪些出故障比较多,是什么原因造成的?假如客户数据和后端运营数据没有打通的话,就很难回答这个问题,因为这个数据,必须通过把两个数据库的数据抽出来做对比,并且在维修数据库中用AI、自然语言理解进行分析,才能找出原因。同理,在零售行业,只有数据打通才能实现360度的客户剖析、精准营销,以及提升运营效率。

w2.png

困扰着IT工作者的一个常见问题是数字化转型该从哪里开始,这个问题其实应该从整体思考。就像玩魔方,想要拼出来六个面,如果先拼好一面再转其他面,这样是拼不出来的,同理,数字化转型也是要有全方位的思考。

而在现实中,这样的误区却很常见,最典型的是很多企业感受到获客特别重要,就优先借用AI、大数据解决获客问题,进而再做其他方面的数字化转型,这是不行的,一定要把所有的面一起实现。数据到用时方恨没有打通,其最大的原因就是没有全方位的数字化转型。

企业数字化转型做的好坏,取决于其找到了怎样的一个CDO(Chief Data Officer),好的CDO知道应该如何搭建核心能力,以及挑选合作伙伴,因此,选择全面的、专业的合作生态系统,更能帮助企业加速数字化转型。

在人工智能领域的突破,微软主要有以下方面的能力:视觉、语音和语言。视觉方面, 2016年152层残差网络图像识别精准率96%,2017年语音识别基准测试误差率5.1%,2018年1月文本理解测试精准率88.5%,3月机器翻译研究系统精准率达到69.9%。

w3.png

微软通过数十年的积累,可以将上述能力应用到产品中,包括:预训练模型,简化解决方案开发;主流框架,构建深度学习应用;预测性服务,赋能数据团队;强大的基础设施,加速深度学习;灵活的部署方式。

以API为例,微软的目标是让全世界每一个程序员都可以让其应用变得智能,八行语句就可以让机器有视觉、听觉语音,有理解自然语言、搜索的能力。微软还可以提供预处理性服务,CPU、 GPU、FPGA等基础设施赋能企业加速深度学习,并且这些服务和模型都有灵活的部署方式。在定制训练中不需要很多的样本,微软AI云服务中本身就拥有很多很好的模型;数据科学家做深度学习的模型时,微软也可以提供算力。

w4.png

一般来讲,企业和独角兽或者比较大的公司谈本地部署模型训练时,起价就是100万人民币,当数据对其开放时,也可以变到零。对微软来说,不用公开数据,本地部署价格就是零,后期按使用次数定价,和云上的模型是一样。语言理解的模型也是如此。

微软翻译的最新成果,可以做到机器翻译和人工翻译没有明显的区别,不产生语法错误,唯一就是说法有一点不同,而翻译的合成声音,和人的声音也是很接近的。小米九发布时,利用微软的声音合成技术,王源的声音出现在发布会现场,达到了自然流畅的效果。

微软Azure认知服务的应用案例

1汽车轮胎缺陷检测

据统计,每起爆胎引起的交通事故是平均死亡一人,这是很严重的问题,所以车胎的安全非常重要。胎测胎检是非常复杂的结构,最关键的是车胎里面不能有气泡,因为在受热情况下容易引起车胎的爆炸。在质检过程中检查有没有气泡是重中之重,气泡非常小,没经过训练的人眼很难看出来,其质检的要求精确度非常高。微软的合作伙伴——洪朴信息通过定制训练不同型号轮胎的各种曲线,实现自动化检测,减少了工作量,使漏检率降低到了7%以下。

2知识图谱驱动智能交互

针对于保险行业,经过对线上50万真实用户提问分析发现,最常见的问题是某某产品是否靠谱、适合不适合我等,回答这些问题就首先要回答该产品属于哪家保险公司、什么险种、疾病开销如何等,这需要对自然语言做很多的处理分析以及搭建分析关系,是一个非常复杂的网络结构,涉及到医疗机构、保险机构等。爱因互动做了一个保险业的知识图谱,即使没有大量的数据,也可以做出准确度很高的模型。

w5.png

w6.png

3、机器学习预测

我再用一个很生动的例子,来说明预测的含义。在过去,都是通过观察过往数据进行决策,如过去发生了什么问题、为什么会造成这样的问题,因为都是过去的事情,类似于盲目地看着后视镜开车,其实这是很可怕的事。而我们要达到的目的,是通过数据看到未来的发展趋势做出决策,这就是预测。比如说零售,下周哪些商品的出货量会比较多一点、什么时候要补货、如何提高转化率等,发展到智能时代,这就代表了预测能力,需要企业把业务问题转化成预测问题,这对于CIO来说是一个困难点。

微软的产品特点就在于帮助用户降低难度,使其变得容易运用。举个例子:要预测某台车的价格,一般通过三个方面,第一,在数据集中找重要特征,第二,选择模型,第三,选择参数,进行各种调试。即使数据科学家有非常丰富的经验,也不能一次调试就得出准确数据,而是要在选择模型后不断调参数,当发现精度不够时,需要再去周而复始的挑选其他模型、调整参数,直到得到精准的数据,这需要耗费大量的时间和人力。

使用微软的自动机器学习,只需要告诉数据是什么、需要做什么、条件是什么,剩下的就是微软自动机器的工作了,自动选模型、选参数、调参数,最后达到要求的准确率。

w7.png

没有任何一个数据科学家一生可以有无数个十万以上的数据集工作,而微软自动机器学习,没有做任何数据清理或者数据特征的工程,利用一顿饭的时间,就可以达到一个数据科学家近两个星期做出来的数据精度。这个模型意味着什么?我不是一个数据科学家,但是我借着微软自动化机器学习,就可以达到数据科学家的水平。这就是微软凭能力降低了门槛,提高了的生产力。

4、数据安全

智能时代,万物互联,大家关注的重中之重是数据安全的问题,这也是微软可以帮助客户解决的。

企业的数据安全、数据泄露的隐患来自三个地方:第一是黑客,恶意的黑客;第二是企业内部员工,尤其是有管理员权限的员工泄露数据;第三是政府以权力索取数据。

在数据安全方面,微软有自己的思考。作为云厂商,微软把客户数据放在云服务器上加密后,把钥匙放回客户那里,如果谁想要获得客户信息,就直接与客户联系。

当今,数据存储时有加密存储,传输时有加密存储,但在运算时就没有加密,黑客只要把虚机攻破以后,在虚机上就可以读取数据。针对于这一问题,微软和英特尔花了五年的时间研究出来一种技术,就是数据即使在运行的时候也是加密的,形成一个真正的全周期的数据保护。

这个技术叫confidential computing绝密计算,它是怎样运行的呢?在数据应用或者运行时候,给数据设置一个黑盒,盒子的内存里包含英特尔可以配合硬件的芯片、微软可以存软件的happy V,盒里面的代码和数据在外面是看不见的。如果有黑客进来,因为设置了权限,他也看不见里面是什么。所以当企业把数据放进去运行时,别人是看不见的。

怎么玩转绝密计算呢?当加密的数据进到具体的机器学习时需要解密,只有当企业的代码、数据在盒子里运行时,微软才会把密钥给到盒子,然后数据被解开,开始自动机器学习。

在实际运用中有怎样的好处呢?举个实例来说明:在美国,很多医院病人的数据量不够,特别是癌症数据。当机器学习时,病人的数据量占比很小时,最后的模型是不精准的,所以医院希望把数据合在一起做机器学习,但这又是不合规的。

然而用绝密计算,这个就变成可能。可以实现把两边的数据一起加密,然后把双方数据一起运行,双方都是代码加密不会泄露数据,双方再把密钥交给中间盒子的数据,最后训练出的模型是超过任何一方的数据可以训练出来的精准度。

w8.png

最后总结一下,在智能时代,是企业可以迅速且低成本获取预测能力的时代,目前各种适用于各种行业场景的AI技术及公司层出不穷,企业数字化转型需要找到合适的、好的合作伙伴来赋能。微软愿意开放自己的技术,赋能整个生态圈,助力企业数字化转型。而且微软的服务特点是用起来省力,成效快,同时还安全。