中国科学院院士陈润生:人工智能大模型仍在发展初期 生物医药行业的应用刚刚开始

11月1日,在2024四川网信“数智领航”第十四期川网联“走进新质生产力前沿”系列活动暨第十届生物医学大数据·智能技术会议上,中国科学院院士、中国科学院生物物理研究所研究员陈润生接受了《每日经济新闻》记者的采访。

陈润生在采访中谈到人工智能大模型现在仍在初期阶段,包括在生物医药行业的应用,仍然有一段漫长的路要走。可以说人工智能大模型在生物医药行业的应用才刚刚开始。

而未来,“人工智能大模型对整个医疗系统的应用和干预是全方位的,从治疗前、治疗中和治疗后都将实现人工智能的应用。人工智能不仅会大大提升医疗的效率,还会使得整个医疗系统发生根本性的变化,变成覆盖全民、全阶段的医疗监督,改变整个医疗的范式。”他说。

中国科学院院士陈润生 图片来源:每经记者 陈星 摄

人工智能大模型在医药领域的应用刚开始

近日,2024四川网信“数智领航”第十四期川网联“走进新质生产力前沿”系列活动暨第十届生物医学大数据·智能技术会议在成都举行。会议现场,来自国内外的医学专家、智慧医疗企业等各方代表共话健康数字新质生产力高质量发展。

作为我国最早从事理论生物学和生物信息学研究的科研人员之一,陈润生表示,总的来说,人工智能大模型现在仍在初期阶段,包括在生物医药行业的应用,仍然有一段漫长的路要走。可以说人工智能大模型在生物医药行业的应用才刚刚开始。

“这些早期的数据应用,包括病案管理、注册基本信息的记录、电子病历的管理等,都是借助大数据实现了流程的自动化。借助这些数据,我们又可以从中分析规律性的部分,进而解决更多的实际问题。虽然仍然在早期,但大数据已经为生物医药行业做出了实质性的贡献。”他说。

以药物早期开发为例,过去的经验是:要开发一款新药,需要10年时间,投入10亿美元。但有了大数据和人工智能的帮助,需要筛选的化合物种类可能从上万种变成了上百甚至几十种,搜索范围变成了原本的1%,新药前期开发的效率大大提升。这都是大数据和人工智能在生物医药领域的应用实践。

数据标准化和整合力是构建医药大模型的关键

在陈润生看来,所有的行业大模型都依赖算力和数据。

“首先,能不能做成一个行业大模型,关键在于建造者掌握了多少行业数据,所以数据是关键所在。但有了数据还需要解决两个问题,一是数据的标准化,二是数据的整合。”他说。所谓数据的标准化,即数据的通用与互认,如果各机构或平台产生数据的标准不统一,就失去了应用的基础。而数据的整合则在于突破数据的单一所有限制,如果无法实现数据共享,大模型的作用及意义就随之下降。

而要解决数据标准化和整合的问题,必须有带头的主体。陈润生认为,以美国为例,解决数据标准化的主体可能是Open AI,而以医疗行业数据为例,则可能需要卫健等相关部门牵头先解决数据源的标准规范问题。除了解决数据标准化问题外,要实现数据整合,也需要这样的机构部门来牵头。

此外,对于医疗机构而言,构建自己的医药大模型仍然是一个成本项目。对于大量受困于盈利问题中的医院而言,如何构建和使用大数据和大模型,是一个成本和效益产出的问题。对此,陈润生表示,“医院认识的提高、管理部门的介入,会逐步解决这个问题。因为使用大数据已经是发展的必然,如果不走这一步,一定会被逐步淘汰。这不是做不做、什么时候做的问题,这是一个必须适应的趋势。谁先做就掌握先机,谁就多获益”。

陈润生说:“人工智能大模型对整个医疗系统的应用和干预是全方位的,从治疗前、治疗中和治疗后都将实现人工智能的应用。人工智能不仅会大大提升医疗的效率,还会使得整个医疗系统发生根本性的变化,变成覆盖全民、全阶段的医疗监督,改变整个医疗的范式。”