关于大数据和人工智能的关系,业界曾经有人做过一个生动的比喻:“如果把人工智能看成一个嗷嗷待哺、拥有无限潜力的婴儿,那么大数据就是喂养这个天才的奶粉。奶粉的数量决定了婴儿是否能长大,而奶粉的质量则决定了婴儿后续的智力发育水平。”
就此,CIO发展中心记者特别采访了几大行的AI负责人,分享了关于大数据和人工智能在银行业应用的前世今生以及二者的区别与联系。
2000年到2010年,国内银行普遍经历了一个数据大集中的过程,完成了数据整合、数据清理和数据的标准化,上线了数据仓库、数据集市等各种决策支持性质的应用,为后来大数据技术的发展奠定了基础。2010年前后,随着日志和用户行为等第三方数据越来越多地被集成到企业内部的数据源中,大数据技术得到了爆发式的发展。
“大数据是将银行的内外部数据进行整合,通过分析建模,用于营销和风险控制。它的应用基本都属于决策优化的范畴,而人工智能则更加广泛。人工智能涉及 NLP、计算机视觉、语音处理,是从2016年开始,在人脸识别、OCR和语音处理获得长足发展之后兴起的。其中基于人工智能的人脸识别技术,主要用于登录和身份验证。”招行人工智能实验室负责人李金龙说,“ AI必然会用到大数据,反过来它又对大数据有促进作用。原来数据湖是数据湖,数据仓库是数据仓库,仓湖是分开的。最近业界提出了仓湖一体的概念,那是因为AI发展后,对非结构化的数据有了自动加工能力,引出了仓湖一体的概念。”
人工智能方面,也有着不同的发展历程和代际划分。清华大学人工智能研究院院长、中国科学院院士张钹教授曾公开发表文章,阐述了人工智能技术发展的三个不同阶段:第一代知识驱动的人工智能,第二代数据驱动的人工智能,第三代结合了知识、数据、算法和算力等 4 个要素,具备安全、可信、可靠和可扩展性的人工智能。
“当代人工智能的三个要素:数据、算法和算力,其中两块和大数据密切相关,一个是数据,一个就是算力。人工智能技术以机器学习为主要的方法,对数据的量和数据多样性有很高要求,因而离不开大数据的支撑。”对于大数据和人工智能的互相依赖,某大行人工智能负责人如此解释,“早期没有发达的互联网、廉价的基础设施,导致人工智能朝着减少数据依赖的方向发展,机器学习这样的技术受到了外部条件的限制。现在人工智能技术的全面发展,反过来又让人们进一步意识到了大数据的价值和重要性,促进了大数据技术的加速发展和普及。”
各行业的数据量和应用环境不同,大数据和人工智能的推广和普及程度也不相同。银行、电子商务和互联网企业是大数据和人工智能技术领域的引领者。根据这些行业的实践经验,两种技术在实际应用中,还面临着多种新的挑战,包括企业战略、管理理念、技术架构和专业团队的建设等诸多方面。
“使用新技术的目的是为了让企业发展得更好,但是纯粹的依靠技术并不能真正解决问题,还在于企业对自己行业的理解和对业务模式的重构,这是关键。”某大银行人工智能负责人说,“企业首先要结合自身的业务模式和组织架构做好顶层设计,然后才能结合大数据和人工智能技术,去进行技术转型和技术赋能。”
对于两种技术在技术架构方面的挑战,招行人工智能实验室负责人李金农表达了这样的看法:“大数据的挑战主要在于整个体系的建设能力,因为现在的数仓都非常大,数据非常多,可能有几个PB。技术体系的速度和稳定性,还要考虑统一服务、统一整理元数据、统一数据门户来提供对外对内的服务。人工智能的挑战主要在于如何跟进和落地的问题。首先是对于新东西要有跟进和研究的能力,这就需要一批专业的人才;然后,还要结合自己业务场景落地。”
除了这些宏观上的因素,一些操作层面的问题,也多少值得我们去注意。比如,交通银行人工智能专家所谈到的数据与算力的实际可得性和数据质量,以及大数据和人工智能项目实施中的合作共研与知识转移等问题。
“单一的数据来源很难保证数据的完整性,特别是涉及到反欺诈和风险管理等一些领域,需要一些跨机构的数据进行共享,会用到联邦学习或者多方的安全计算技术,”建设银行人工智能负责人补充说, “这方面既有挑战,也有机会,可以去做一些联邦式的大规模深度学习和机器学习的应用。”
正如业界专家所言,在大数据和人工智能的应用方面,我们现在只是刚刚到了山脚下,而未来要达到的,可能是一个山峰。我们对于这些技术和项目的长期投入要有明确的认识,不能急于求成。只有这样,才能取得最后的成功。
参考资料:《大数据和人工智能是啥关系?》作者:小白人智媒体