微软CTO谈智能时代的企业数字化转型_专访

微软CTO谈智能时代的企业数字化转型

2019-04-19　　来源：CIO发展中心

大中小

前言：未来就在眼前，人工智能的时代已经到来，企业数字化转型将是全方位的转型。本文通过采访微软(中国)有限公司首席技术官徐明强，谈微软如何定义数字化转型，并利用领先的技术和成熟的商业生态，予力更多企业完成数字化转型。

徐明强封面.jpg

微软(中国)有限公司首席技术官徐明强

我们现在经常提及数字化转型，但其实数字化转型并没有一个明确的定义，今天，就想和大家分享一下微软是如何定义数字化转型的。在定义之前，首先需要明确IT时代和智能时代的区别：

在IT时代，英特尔借助摩尔定律一代又一代的驱动了计算能力的增加，而微软实现了盖茨的愿景——每家都有PC。经济学家认为，IT时代大的特点是计算能力的价格的下降，这意味着生产力的变革。“码农”把业务问题通过编程和编译器变成了计算问题。

而智能时代或说数字化时代，在经济学家看来，是因为计算机算力的加强、数据的增多、算法增加等种种原因，造成现在预测能力的价格变低。如今，所有问题都变成了预测能力，如企业业务中的AI洞见，阿尔法狗预测每一步下完后的胜率是多少，同样，计算机视觉、语言、翻译也变成预测了的问题。

那么知道IT时代与智能时代的主要区别后，我们要如何看待企业的数字化转型呢？

首先必须要做好数字化闭环，这基于四个支柱: 密切客户沟通、赋能员工、优化运营、转型产品。最关键的是外环的圈，这意味着数据的连通：各种各样的信号从各种源传输过来，如客户传来的信号、产品从物联网传来的信号、企业员工的信号、后端运维数据传来的信号等等，如果数据没有打通的话，业务中的问题就很难回答。

列举一个最常见的例子：制造业的老总问，最近发出的产品中哪些出故障比较多，是什么原因造成的？假如客户数据和后端运营数据没有打通的话，就很难回答这个问题，因为这个数据，必须通过把两个数据库的数据抽出来做对比，并且在维修数据库中用AI、自然语言理解进行分析，才能找出原因。同理，在零售行业，只有数据打通才能实现360度的客户剖析、精准营销，以及提升运营效率。

困扰着IT工作者的一个常见问题是数字化转型该从哪里开始，这个问题其实应该从整体思考。就像玩魔方，想要拼出来六个面，如果先拼好一面再转其他面，这样是拼不出来的，同理，数字化转型也是要有全方位的思考。

而在现实中，这样的误区却很常见，最典型的是很多企业感受到获客特别重要，就优先借用AI、大数据解决获客问题，进而再做其他方面的数字化转型，这是不行的，一定要把所有的面一起实现。数据到用时方恨没有打通，其最大的原因就是没有全方位的数字化转型。

企业数字化转型做的好坏，取决于其找到了怎样的一个CDO（Chief Data Officer），好的CDO知道应该如何搭建核心能力，以及挑选合作伙伴，因此，选择全面的、专业的合作生态系统，更能帮助企业加速数字化转型。

在人工智能领域的突破，微软主要有以下方面的能力：视觉、语音和语言。视觉方面， 2016年152层残差网络图像识别精准率96%，2017年语音识别基准测试误差率5.1%，2018年1月文本理解测试精准率88.5%，3月机器翻译研究系统精准率达到69.9%。

微软通过数十年的积累，可以将上述能力应用到产品中，包括：预训练模型，简化解决方案开发；主流框架，构建深度学习应用；预测性服务，赋能数据团队；强大的基础设施，加速深度学习；灵活的部署方式。

以API为例，微软的目标是让全世界每一个程序员都可以让其应用变得智能，八行语句就可以让机器有视觉、听觉语音，有理解自然语言、搜索的能力。微软还可以提供预处理性服务，CPU、 GPU、FPGA等基础设施赋能企业加速深度学习，并且这些服务和模型都有灵活的部署方式。在定制训练中不需要很多的样本，微软AI云服务中本身就拥有很多很好的模型；数据科学家做深度学习的模型时，微软也可以提供算力。

一般来讲，企业和独角兽或者比较大的公司谈本地部署模型训练时，起价就是100万人民币，当数据对其开放时，也可以变到零。对微软来说，不用公开数据，本地部署价格就是零，后期按使用次数定价，和云上的模型是一样。语言理解的模型也是如此。

微软翻译的最新成果，可以做到机器翻译和人工翻译没有明显的区别，不产生语法错误，唯一就是说法有一点不同，而翻译的合成声音，和人的声音也是很接近的。小米九发布时，利用微软的声音合成技术，王源的声音出现在发布会现场，达到了自然流畅的效果。

微软Azure认知服务的应用案例

1、汽车轮胎缺陷检测

据统计，每起爆胎引起的交通事故是平均死亡一人，这是很严重的问题，所以车胎的安全非常重要。胎测胎检是非常复杂的结构，最关键的是车胎里面不能有气泡，因为在受热情况下容易引起车胎的爆炸。在质检过程中检查有没有气泡是重中之重，气泡非常小，没经过训练的人眼很难看出来，其质检的要求精确度非常高。微软的合作伙伴——洪朴信息通过定制训练不同型号轮胎的各种曲线，实现自动化检测，减少了工作量，使漏检率降低到了7%以下。

2、知识图谱驱动智能交互

针对于保险行业，经过对线上50万真实用户提问分析发现，最常见的问题是某某产品是否靠谱、适合不适合我等，回答这些问题就首先要回答该产品属于哪家保险公司、什么险种、疾病开销如何等，这需要对自然语言做很多的处理分析以及搭建分析关系，是一个非常复杂的网络结构，涉及到医疗机构、保险机构等。爱因互动做了一个保险业的知识图谱，即使没有大量的数据，也可以做出准确度很高的模型。

3、机器学习预测

我再用一个很生动的例子，来说明预测的含义。在过去，都是通过观察过往数据进行决策，如过去发生了什么问题、为什么会造成这样的问题，因为都是过去的事情，类似于盲目地看着后视镜开车，其实这是很可怕的事。而我们要达到的目的，是通过数据看到未来的发展趋势做出决策，这就是预测。比如说零售，下周哪些商品的出货量会比较多一点、什么时候要补货、如何提高转化率等，发展到智能时代，这就代表了预测能力，需要企业把业务问题转化成预测问题，这对于CIO来说是一个困难点。

微软的产品特点就在于帮助用户降低难度，使其变得容易运用。举个例子：要预测某台车的价格，一般通过三个方面，第一，在数据集中找重要特征，第二，选择模型，第三，选择参数，进行各种调试。即使数据科学家有非常丰富的经验，也不能一次调试就得出准确数据，而是要在选择模型后不断调参数，当发现精度不够时，需要再去周而复始的挑选其他模型、调整参数，直到得到精准的数据，这需要耗费大量的时间和人力。

使用微软的自动机器学习，只需要告诉数据是什么、需要做什么、条件是什么，剩下的就是微软自动机器的工作了，自动选模型、选参数、调参数，最后达到要求的准确率。

没有任何一个数据科学家一生可以有无数个十万以上的数据集工作，而微软自动机器学习，没有做任何数据清理或者数据特征的工程，利用一顿饭的时间，就可以达到一个数据科学家近两个星期做出来的数据精度。这个模型意味着什么？我不是一个数据科学家，但是我借着微软自动化机器学习，就可以达到数据科学家的水平。这就是微软凭能力降低了门槛，提高了的生产力。

4、数据安全

智能时代，万物互联，大家关注的重中之重是数据安全的问题，这也是微软可以帮助客户解决的。

企业的数据安全、数据泄露的隐患来自三个地方：第一是黑客，恶意的黑客；第二是企业内部员工，尤其是有管理员权限的员工泄露数据；第三是政府以权力索取数据。

在数据安全方面，微软有自己的思考。作为云厂商，微软把客户数据放在云服务器上加密后，把钥匙放回客户那里，如果谁想要获得客户信息，就直接与客户联系。

当今，数据存储时有加密存储，传输时有加密存储，但在运算时就没有加密，黑客只要把虚机攻破以后，在虚机上就可以读取数据。针对于这一问题，微软和英特尔花了五年的时间研究出来一种技术，就是数据即使在运行的时候也是加密的，形成一个真正的全周期的数据保护。

这个技术叫confidential computing绝密计算，它是怎样运行的呢？在数据应用或者运行时候，给数据设置一个黑盒，盒子的内存里包含英特尔可以配合硬件的芯片、微软可以存软件的happy V，盒里面的代码和数据在外面是看不见的。如果有黑客进来，因为设置了权限，他也看不见里面是什么。所以当企业把数据放进去运行时，别人是看不见的。

怎么玩转绝密计算呢？当加密的数据进到具体的机器学习时需要解密，只有当企业的代码、数据在盒子里运行时，微软才会把密钥给到盒子，然后数据被解开，开始自动机器学习。

在实际运用中有怎样的好处呢？举个实例来说明：在美国，很多医院病人的数据量不够，特别是癌症数据。当机器学习时，病人的数据量占比很小时，最后的模型是不精准的，所以医院希望把数据合在一起做机器学习，但这又是不合规的。

然而用绝密计算，这个就变成可能。可以实现把两边的数据一起加密，然后把双方数据一起运行，双方都是代码加密不会泄露数据，双方再把密钥交给中间盒子的数据，最后训练出的模型是超过任何一方的数据可以训练出来的精准度。

最后总结一下，在智能时代，是企业可以迅速且低成本获取预测能力的时代，目前各种适用于各种行业场景的AI技术及公司层出不穷，企业数字化转型需要找到合适的、好的合作伙伴来赋能。微软愿意开放自己的技术，赋能整个生态圈，助力企业数字化转型。而且微软的服务特点是用起来省力，成效快，同时还安全。

微软智能时代企业

您可能感兴趣的文章