本文根据凯莱英集团实验室数智化部门总监邢林书在“CIAPH-2024医药数字化巡展之北京站”活动中的分享整理
前 言:数智化建设没有终点,任何时间都是起点
邢林书 凯莱英集团实验室数智化部门总监
大家好,我是来自凯莱英的邢林书,非常高兴今天有机会分享凯莱英在数智化建设过程中的一些实践和心路历程。
背景及驱动力
首先从驱动力的角度来说,凯莱英医药集团(下文简称“凯莱英”)是一家全球领先、技术驱动型的CDMO(医药合同定制研发生产)一站式综合服务商,为全球超1100家客户提供了药品全生命周期的一站式CMC服务、高效和高质量的研发与生产服务,加快创新药的临床研究与商业化应用。是全球排名前列的创新药原料药CDMO,中国最大商业化阶段化学药物CDMO公司,实现“A+H”双市场上市。
公司拥有八大研发生产基地,以及分布在天津、吉林、辽宁、上海、江苏、美国BOSTON、英国SANDWICH等地的二十余家研发、生产、销售子公司及办事处,如何做好对于实验室的数字化管理,这对于凯莱英来说是必须解决的问题。
从业务范围来看,小分子是凯莱英的优势领域,除此之外,在生物大分子,ADC、小核酸、多肽等新兴领域,凯莱英也有所涉猎。凯莱英旗下的子公司凯诺医药作为一个CRO公司,也进一步完善了凯莱英集团的GXP一站式全生命周期服务与管理。
在整个生命周期的服务管理中,实验室的管理是至关重要的。目前全球员工近万名,研发人员占比超48%,可以说实验室是凯莱英的一个重要的生产力。对于实验室如何进行管控管理,怎样进行数字化转型,受到了集团的高度重视。
对于整个医药健康行业来说,合规是药企最基本的要求,因此很多药企会在法规的范围内对供应商提出更高的要求。因此作为CDMO企业,凯莱英需要进一步提升质量、安全,在法规允许的范围内做好效率提升,紧跟行业趋势,IT领域也是如此。
在如今这样一个亟需降本增效的市场环境下,凯莱英不但要实现自身的降本增效,还要帮助其他药企来实现这样的目标,所以聚焦到IT层面,就变成了一个内部需求,几千人的研发、分析团队,成千上万台设备,怎样高效协作,流程如何打通,这些痛点使我们数字化转型的需求更加迫切。
提到数字化转型,凯莱英更加聚焦于实验室的效率提升,也就是从人、设备、流程、SOP等方向的优化,来提高业务效率。其中最为关键的三个核心是数据、技术、业务。从IT的角度来说,需要通过技术,用信息化、数字化、智能化手段,提升人效和设备的周转率。收集过程中产生的大量数据,通过数据治理,分析,进一步反哺信息化,以及为业务提供数据参考和优化方向。总体来说,业务、数据、技术三者要整合到一起,并且在合规安全的框架内相互促进。
建设原则和策略
实验室数智化建设的原则就是加快全球的信息化和数字化覆盖,充分利用智能化技术赋能业务。凯莱英采用集团统筹的方式,各厂各地分步实施。
目前市场上关于实验室的系统和应用有很多,但数字化的关键在于如何将这些系统有机的整合起来。同时需要把数据进行整合,通过对数据的挖掘和分析,来指导企业的决策,为企业发展方向提供建议。
在研发领域,凯莱英自研了STAR平台,并且免费对外开放。该平台利用机器学习和深度学习技术进行蛋白质结构设计。在开发该平台的过程中,IT/AI团队持续与研发实验室的科学家进行沟通,进行数据清洗和模型训练,并在项目中反复测试和调优。将每轮需要实验的样本数减少到最低近百个,仅需迭代 1~2 轮,最快1个月就可以获得活性提高 50 倍以上的优势突变株,研发效率大大提高。
这里为大家举了两个案例,第一个是通过点突变优化蛋白溶解度,在使用时只需要输入蛋白质序列,通过算法,能够预测突变点位,根据每个突变点位的稳定性做相应预测,并形成四象限图,通过象限中的点位就可以开展进一步的研究。平常这些突变点位都是需要靠实验来得出结论的,应用系统后,就可以在象限中进行分析。
第二个是预测多肽保留时间,多肽保留时间预测是蛋白质组学研究中的一个重要环节,它有助于改善多肽鉴定的准确性,优化蛋白质组学测定条件,并提高数据非依赖采集中质谱数据的检出率和重复性,STAR系统通过训练大量的多肽保留时间数据,建立预测模型,并对新的多肽进行保留时间的预测。这种方法相较于其他预测的方法具有预测速度快、准确性高等优点。
我们的IT/AI部门也在和化学大分子研发部门进行合作,通过构建自己的多肽和寡核苷酸片段库来帮助未来的分子对接和蛋白酶设计,从IT的角度来帮助科学家提高实验室的工作效率。
在临床前实验室,有一项重要的工作就是生成报告,科学家需要根据实验数据,形成统计模型,根据结果和趋势形成报告。往往这样每一个报告需要花费的时间就在一周的左右,我们开发了一个平台,将实验的原始数据,根据所需要的统计算法形成统计报告,再根据这些报告结果以及相关的要求,通过大模型生成符合要求的报告。
此外我们也进行了IoT相关的尝试,但过程中遇到了很多挑战,例如想要把线下的数据做到线上,就需要与设备连接,这就会涉及到老旧实验室中的网络升级、布线、接口的对外输出、协议的输出等等。通过IoT,我们可以通过一些无线的方式进行连接,不需要对实验室进行大规模的改造。通过移动端的方式,我们也免去了在特定区域布置电脑,就可以进行打标签、出入库、消耗品的管理。
我们尝试通过IoT来解决最后一公里的问题,将数据更方便、快捷高效的连到系统中。未来我们还可能通过VR眼镜来解放双手,通过语音控制系统来进行一些操作。
最后,数智化建设是一项没有终点的工作,新技术会持续发展,业务也将持续变化,所以未来我们将在和客户沟通交流的过程中寻找智能化的转型点,现在我们的IT人员每天都在实验中帮助科学家发现工作的痛点,帮助业务人员提高效率,可以说数智化任何时间都是起点。