本文根据诺华制药中国区数据数字信息技术负责人李智伟在CIAPH-第13届医药健康行业数字化高峰论坛”上的分享整理
李智伟 诺华制药中国区数据数字信息技术负责人
大家好,我是来自诺华制药的李智伟。今天,我将重点分享生成式人工智能在工作场景中面临的挑战、对应的解决方案以及从中总结的实践经验。
首先一起来看诺华的生成式AI的布局。最基础的内容我们选择拿来主义,除了生产一线和销售的同事,我们为知识型员工都配备了微软的Copilot,极大提升他们的日常工作效率。我们还在内部使用了internal ChatGPT,这个工具与DeepSeek类似,但是本质区别是数据不会被用作大语言模型的再次训练,以保证企业数据安全。以上讲到的都是普惠型的生成式大语言模型,也就是拿来即用的工具。
第二类是企业平台应用内置,像ERP、CRM或者内部管理系统、内部服务的工作流引擎。诺华也在SAP中建立大语言能力,为企业内部服务部门比如说人力资源、IT部门提供的大语言模型能力。这一部分的重点是利用好套件,要具有一定的前瞻性,避免重复造轮子。
第三类是定制化大语言模型的应用。诺华也进行了广泛的尝试,IT需要做好取舍,一定要聚焦。诺华打造了一个GAIN平台,其中接入微软的模型和能力,以及AWS的Bedrock,还有本土的DIFY大语言低代码开发平台,通过简单拖拉拽的方式,来实现workflow,甚至是AI agent。这部分重点是通过IT提供的一系列工具,让业务里有一定技术知识的同事,可以快速低成本,在安全可控的环境下进行探索,创造出更多业务价值。
通过以上的愿景和工具,诺华还进行了更加细致的治理。早期诺华不同部门都想要打造自己的大语言模型,也就导致了重复造轮子,系统做出来以后没人运维,成为技术债。但我认为这是一个必然阶段,每个事物的发展都需要经历从混乱到有序。所以诺华现在形成了一个AI治理架构。
最上面是一把手挂帅,CEO和高管团队都非常重视,我们设立一个管理委员会。在此之下我们还有不同部门组成的AI领导委员会,领导委员会一起审批要做什么。尤其近年来,我们会更加看重真正的回报,如果项目没有办法讲清楚回报,那很可能就拿不到投资,这也是确保公司资源不被浪费。再往下是IT为核心,引入了AI卓越中心。在我看来,生成式大语言模型项目必须要要有懂AI的人来做,所以诺华卓越中心负责交付、项目管理、运维。
AI论坛是一个交流中心,会把一些好的案例比如说生产中SOP标准操作流程等内容引入到聊天机器人中,帮助新老员工快速找到需要的SOP文件,通过AI 论坛,能够避免重新造轮子的问题,同时也可以从其他生成式语言模型和案例中找到一些灵感。
AI素养提升也非常关键。简单来说是让所有员工提升使用AI的意识和能力。过去我们做了一套体系化的课程,但是与预期相差很大。后来我们发现不同的工作岗位所关心的重点也有所不同,所以有效的方式是根据不同的岗位、不同的部门,制定相应的特殊培训计划。这样一来,得到了更大的提升,也形成了飞轮效应。业务员工更愿意使用生成式大语言模型,会产生更多好点子,反哺AI卓越运营中心,让IT能够去做更多给公司带来价值的项目。所以我认为以上提到的三要素是非常重要的。
对于CIO来说,我认为CAIO是一个未来的机会,当企业进入到平稳运营的阶段,需要IT真正把AI落地和运营起来。对于诺华来说,IT部门的定位很清楚,IT部门是要支持业务部门,负责搭建平台,把好用、性价比高、安全的模型以及AI的使用方式和规范带到公司里。IT部门更像是平台运营商,而业务才是应用的主人。值得关注的是,未来可能有些部门和员工会由AI智能体替代,所以IT部门应做好长期的规划。
对于项目的选择,有几点需要考量:首先是技术是否能够支持,其次是业务是否有真正的需求。近期我们在做一个医学文献AI翻译项目,这类文件的翻译对于准确性的要求极高,为什么我们选择这个项目,第一从技术上说是ready的,另外我们的研发负责人明确表示希望通过人工智能和大语言模型提升效率,降低运营成本。通过这个案例我想表达的是选择项目一定要关注业务、由业务负责人来确定目标,这样就更容易把项目落地,对于IT来说,是因为相信所以看见,但对于业务来说,更多的是看见了才会相信,所以在诺华我认为需要更多的成功故事,而且故事还需要业务合作伙伴来讲才是最好的。
总的来说,大家在选择生成式大语言模型时,一定要分清以下两点,第一是做真正的产品还是POC,第二是业务合作方是不是有决心要把这个事做成?当然有了业务的决心,技术也支持的话,那么事情大概率能做成。
关于安全合规的使用Gen AI。如果是通过API的方式接过来,要考虑数据交换是否有泄漏的风险,我们采取的方式是只与最靠谱的公司合作。在合规方面,诺华在全世界不同的地方都有运营,但很多国外的模型没有得到中国的认证,所以我们在中国用的是国内头部互联网公司的大语言模型,确保100%合规。
此外AI的道德风险也要引起大家的重视,医药行业与其他行业不同,我们的信誉,医疗机构、医院医生、患者对于我们信任的价值是无法衡量的,一旦使用AI对公司造成负面影响,那对于公司无形资产的破坏是巨大的。
在诺华我们会有两层保护,第一层是当我们在选择一个模型时,会对厂商进行非常深入的沟通和了解。第二层是真正进行到应用阶段,需要由我们内部的某一个岗位进行验证后再进行使用,这是必须要走的流程,以确保我们是负责任的使用AI。另外,在我们通过AI生成的建议一定要能够被解释,未来诺华可能会更多用起来可以看到它的思考链的方式的人工智能。
对于模型的选择和使用,诺华既使用了商业模型,也使用了开源模型,还有私有化部署和API。在私有化部署的时候,我们会考虑模型的参数大小和经济性。例如上文讲到的翻译,虽然要求很高,但是我们经过测试,出于对效果和成本的考虑,选择了32B的模型而没有选择70B的模型。
在应用上,很多医药公司并不会做预训练。我们做的最多是用提示词工程把我们的预设给到人工智能,一些内部的数据,我们可以通过RAG的方式挂进去。我原来一度认为只要用API,用这个提示词工程和RAG能解决99%的问题。但是随着模型的发展以及内部应用的深入,我发现微调也是非常重要的。随着模型的多样化,尤其是一些效能更高的模型,它的推理成本、培训成本的降低,我们可能会有更多的用到微调的这样的用例出现。
展望未来,我认为可见的趋势是生成式大语言模型,不管是培训还是推理,它的成本会有非常明显的持续下降,这里面驱动力来自于第一算力的效率会提升,第二是模型本身的一个调优。未来可能很多自定义开发会被融入到套件中,所以在选择项目时一定要具有前瞻性,充分评估项目的价值。关于AI智能体,让它自动化地做出来,真正的可以帮助我们的同事,不是只解决一个具体的问题,而是实现端到端的解决问题,真正成为大家的助理。未来我们还会在这一领域不断寻求机会,为下一步做好准备。
最后希望我们都能够抓住生成式大语言模型的机遇,创造更多的价值。谢谢大家。