毫无疑问,2025年将成为AI智能体爆发之年:OpenAI 曾推出《管理AI智能体的实践白皮书》(Practices for GoverningAgentic AI Systems ),将大模型的风口推向了 AI 智能体。IEEE 专家在 2025 CES上表示,人工智能的下一步可能是能够制定计划并将其付诸行动的人工智能代理(智能体),代理性人工智能(智能体人工智能)也将对医疗健康、制造业、市场营销和网络安全等领域产生重大影响。Gartner 更将 AI 智能体列为 2025十大战略技术趋势之首。
?
AI医疗从未像如今这般热闹过。过去一个月,国内AI医疗公司股票集体上扬,大洋彼岸,以AI精准医疗公司Tempus AI为首,美股医疗AI公司也迎来了一波爆发。乘着这一东风,作为在全球大模型与生成式 AI 以及生命科学研究领域的前沿创新组织,水木分子已率先投入生物医药智能体相关研究。
?
3月7日,由水木分子主办,同写意协办,上海市科学技术委员会、杨浦区科技和经济员会、启迪之星(上海)支持的“首届 AI For Life Science 智能体创新峰会暨水木分子春季战略与产品发布会”在上海成功举办。近两百位来自生物医药与人工智能领域的专家学者、企业家、行业领袖与投资人,共同在这场峰会中研讨大模型时代的生态合作。
?
?
2025 AI For Life Science 智能体创新峰会上,水木分子与金赛药业、凯莱英(临床)凯诺、晟然为安、天津市药物临床研究技术创新中心、序祯达生物、钉钉(中国)等进行了战略合作签约,共同探索和加速 AI 在生命健康领域的突破创新;还与先导药物、英飞智药、嘉华药锐、药渡智慧等战略合作成立了“AI 生物医药源头创新联合体”,该联合体将致力于将人工智能融入药物研发最具挑战性的前端,助力筛选最优的靶点、最优的分子,加速新药的开发;同时宣布与博奥晶方、美年大健康、升泷科技、美国健康产业集团等战略合作成立了“AI 中医药大健康联合体”,该联合体将以 AI 大模型为枢纽,融合基因-蛋白组学筛查、中医证候智能解析、跨国健康数据联动,打造“早筛预警-靶向干预-智慧诊疗-全病程管理”的闭环生态,让前沿算法与千年医学智慧共铸精准健康新范式。
?
以下是“2025 AI For Life Science峰会”的部分摘录内容(按照演讲顺序整理):
?
人机协作新范式下,?
科学家将充分发挥人类的创造力、经验和直觉
张亚勤,
中国工程院院士,清华大学讲席教授,清华大学智能产业研究院(AIR)院长
?
张亚勤院士在致辞中介绍,“人工智能加速科学发现已成为国际研究的前沿领域,为解决全球性挑战注入了强大的动力。无论是疾病流行造成的生命威胁,还是气候变化带来的严峻考验,还是可持续发展面临的重重困难,人工智能都有望提供创新的解决方案,进而带来巨大的社会与经济效益。生命科学关系着人类对自身的理解,因此至关重要。”
?
如今,大模型与生成式AI技术正引领科学研究进入一个全新的人机协作新范式。生命科学智能体的出现与广泛应用,将彻底改变科学发现的进程,大幅提升科研效率。张亚勤院士强调,“在这一新范式下,科学家的角色将更加聚焦于提出高质量的问题和任务描述,充分发挥人类的创造力、经验和直觉。而智能体则通过高通量的文献阅读、海量实验数据分析、算法迭代与任务执行,成为科学家最得力的助手。这种深度的人机协作,将推动科学研究进入一个全新的时代。”
?
此次由AIR和水木分子联合推出的OpenBioMed生命科学智能体开源平台,是生命科学领域的重要进展。通过直观的拖拽式操作界面,研究人员可以轻松调用最前沿的AI算法与工具,快速构建专属的科研智能体。这一创新不仅大幅降低了AI技术的使用门槛,更为重要的是,它成功搭建起了生物学家与计算机科学家之间的高效协作桥梁。
?
最后,张亚勤院士总结,“我相信,科研智能体与科学家的深度融合,将成为推动生命科学创新发展的重要引擎,为破解生命奥秘、攻克医学难题提供强有力的技术支撑。”
?
生物大模型进入加速涌现期,
智能体知识图谱引领生命科学研发新范式
聂再清博士
清华大学国强教授、清华大学智能产业研究院 AIR 首席研究员、水木分子首席科学家
?
当下,大模型和智能体的技术发展,是数字化浪潮迄今为止最具革命性的时期,各个行业正在被大模型和智能体技术快速改写。
?
聂再清博士预测,“未来两到三年,生物语言模型会像自然语言模型一样大面积智能涌现。未来,会有大批的新药项目会通过AI和专家协作完成。为什么会有这样的预测?因为2025年被视为AI智能体爆发之年。我们的大模型技术已经发展到一个成熟的阶段。大模型已经可以构建人类的思维过程,某些地方甚至达到甚至超过专业人员的水平。例如,AlphaFold3干实验结果的准确度和精度,几乎可以媲美人类专家操作的湿实验结果。但是,目前通用大模型对生物模态数据的理解仍然不足,生物专家可能也不具备AI背景,使用相关的AI工具可能具有一定壁垒。如何打破学科之间的壁垒,实现多任务多领域协作?这需要专业的工具和人才来助力。”
?
聂再清博士介绍,“基于这一痛点,水木分子推出了生物医药智能体开源平台,该生物医药智能体架构和平台分为三层:知识基础层为行业知识与企业私有知识层;中间层为 AI Agent 智能体引擎层,包括大型推理模型与生物医药模型和工具;最上层为行业和私有任务智能体层,可助力新药立项与决策、临床前药物发现、临床试验以及企业私有任务等。”
?
在知识基础层中,水木分子首次提出了智能体知识图谱概念和滚雪球式知识挖掘智能体,为 AI Agent 提供高质量的行业知识。在高质量专业与企业知识的基础上,水木分子更新和推出了ChatDD药物研发智能体系列、 PharMolixFM全原子基础大模型等系列推理大模型;水木分子还与清华大学 AIR 携手推出了 BioMedGPT-R1 开源多模态生物医药推理大模型和 OpenBioMed 生命科学与药物研发智能体开源平台。基于上述平台,可让具备推理大脑的智能体能够进行思维链学习,智能调用生物医药模型、工具、算法和 API,在生物医药场景下逐渐形成“长、短期”记忆,并以自然语言方式与用户交互,从而实现智能化支持各项药研任务。
?
聂再清博士形容,“生物医药行业此前开发新药的主要途径是‘老法师(专家)’做实验,属于TMDD阶段(传统药物设计),专家的经验直觉非常重要;后来发展到CADD(计算机辅助药物设计),‘老法师’仍然发挥主动权;到AIDD(AI辅助药物设计)阶段,虽然一些AIDD公司宣传创新药物可以通过AI独立研发,但难度非常大,干湿试验数据也难以有效结合。新药开发最好的方式是‘老法师’专家和AI密切地交互结合。”
?
聂再清博士解释,“水木分子希望能够把专家的经验和直觉与大模型目前对生物这一部分的理解能力融合在一起:一方面把专家的经验跟直觉用对话的形式告诉大模型、去帮助大模型思考,另一方面把大模型设计的结果用自然语言解释给专家听。这样不仅可以让‘老法师’更好地理解生物数据,也让生物数据和大模型算法推荐结果更具解释性。人和大模型的有效融合,能够弥补现在生物模态本身还没有完全实现涌现智能的不足。”
对于智能体知识图谱,水木分子产品负责人胡沁书女士补充,“智能体知识图谱通过千余高质量专家筛选数据源,具有海量的权威数据作为基石。截至二月底,该平台已收集了千万级权威实体,包括药物、靶点、疾病、公司等立项调研与研发关键实体;建立了亿级关系数量,包括药物作用靶点、药物治疗疾病、靶点相关疾病等;关联了亿级优质文本索引,包括权威论文、会议等相关文本片段。”
水木分子高级产品总监胡沁书发布公司2025战略级新产品:ChatDD智能对话药物研发智能体系列——ChatDD-Insight、ChatDD-Discovery和ChatDD-Trial
针对滚雪球式生物医药知识挖掘智能体,水木分子CTO乔木博士讲解,“该智能体主要用于构建和扩充智能体知识图谱。该智能体仅需少量种子知识即可从文本知识库中开始知识挖掘:通过 ChatDD 置信度计算,对于低置信度的抽取知识数据,由生物医药专家进行判断和数据清洗;将高置信度的抽取知识和专家清洗后的数据,纳入知识图谱;通过主动学习方法选取训练数据,通过有监督微调实现模型的迭代升级;如此不断循环,获得高质量的智能体知识图谱。水木分子为滚雪球式生物医药知识挖掘提供了一站式人机协作平台,进行知识的整合补全。该一站式人机协作平台引入生物医药专家对置信度不高的知识进行人工确认。同时,该平台能够进行知识图谱的新实体推荐、新实体建议以及新关系/文本推荐。通过一站式人机协作平台,生物医药专家能够与智能体一起高效协作,完成智能知识图谱的搭建和扩展,既能对海量文本数据库进行知识挖掘,也能对机构和企业私有/专有文本数据库进行知识挖掘。”
?
水木分子首席技术官乔木博士发布公司2025战略级新产品:ChatDD智能对话药物研发智能体系列——ChatDD-Insight、ChatDD-Discovery和ChatDD-Trial
未来,在“老法师”和AI的协同努力下,创新药这场漫长的人工马拉松,将蜕变成一场AI驱动的百米冲刺。
人工智能的下一波浪潮,
不是数据驱动,而是逻辑驱动
徐峻教授
中国科学院合肥物质院健康与医学技术研究所、生物医学大数据研究中心主任、
香港中文大学(深圳)铁代谢联合实验室主任、前中山大学药物分子设计中心主任
?
药物创新的终极问题是什么?其本质是设计合成出具有优异的药效、特异而选择性地与给定药物靶标结合、快速可追踪地递送且能进入临床试验的分子。在药物创新的过程中,AIDD必须比人类化学家更快、更高效、更具创造性地提出有可理解理由的、可信的、可合成的分子。AIDD还应该具有成本效益可访问性,成为每个化学家桌面上思想探索的标准工具。
?
这种情况下,生物医药专家会不会失业?徐峻教授解释,“就像人类发明的飞机迭代了人类旅行的方式,我认为AI在某些方面也会超过人类,帮助‘老法师’进行药物的创新。‘老法师’应该拥抱这些新技术,不必过于忧虑。但是,目前药物创新过程的一大痛点是如何选定候选药物进入临床不是简单地通过大语言模型所能解决的,“它涉及基于严格因果关系嵌套的泛函数问题。”
?
为了解决药物创新过程的各种泛函问题,我们需要厘清其中的底层逻辑,即各个层次的机理。徐峻教授认为,最根本的底层逻辑有两个:“一是药物如何从宏观世界进入微观世界。例如,染色体DNA的长度约为1.8米,它是是如何被塞进直径只有10微米的细胞核内空间的,其中的密码子又如何在极短大的时间尺度内被读出的?。二是药物分子如何通过微观尺寸的微观分子调控导致细胞的表型变化,最终修改了人体的宏观状态?。”
?
因此,我们首先要理解研究对象的物质层次和时间尺度,从中筛选出与生命物质相关的分子,例如核酸、蛋白质、脂质体、辅酶、内源性小分子、外源性小分子、细胞、组织、器官、微生物等,这些分子物质结构的划分与重组依赖于对现有生物医学研究中的原始数据,其源头包括高通量实验产生的大数据、信息化产生的大数据、科技文献/专利文献产生的大数据以及模拟计算产生的大数据。
?
徐峻教授指出,“我们需要处理和理解这些大数据,把这些大数据整合到合理的逻辑体系中。生物大数据处理既包含数据采集、标引、存储、检索、分享等基本功能,还具有复杂、多维、高噪声、不完备等特性。例如,生物学揭示表型背后的遗传基因,需要测序百万到亿万种物种基因,并完成正确的基因注释;生物学数据具有基因组、蛋白组、代谢组、微生物组、细胞、组织、器官、个体、种群、社会等多个层次;地球上约有万亿种生物有机体,但其中99%未测序;谷歌团队为了解决蛋白质折叠预测问题,将蛋白质结构数据库从19万序列拓展到20亿序列。”
?
面对这些复杂庞大的生物数据,我们需要何种智能算法?徐峻教授认为,“在我看来,人工智能的下一波浪潮更取决于逻辑驱动。没有逻辑驱动的人工智能,是没有思想和‘人格’的人工智能。从表面上看,数据驱动的人工智能可以更快速、更高效地发现事物之间的关系,但是这个关系也许并不是因果关系。例如,基于大数据可以发现‘日出’和‘公鸡叫’之间有密切关系,大数据人工智能可能会得出一个结论‘公鸡把太阳叫出来了’。从统计学上来看,这个结论没有错误。但是,如何证明是‘太阳把公鸡叫出来’还是‘公鸡把太阳叫出来’,这就需要做实验。在生物医药领域,我们同样需要确定因果关系。”
?
回看过去,AlphaFold 1 用卷积神经网络预测了单体的蛋白质结构,AlphaFold 2 则用Transformer和多序列比对解决了蛋白质的分子组装问题,AlphaFold 3 用扩散模型解决了生物分子精细组装问题。但是,在后大语言模型时代,人工智能辅助药物发现技术还有漫长的道路要走。
?
人工智能赋能临床研究,
从提高效率到提高成功率
孙立英教授
前美国 FDA 资深流行病学家/评审专家、NIH/NCI?统计学家/项目主任、
美国杜克大学教授/前列腺病信息中心主任、ICH?E15专家组专家
?
AI时代,数据为王。数据和特征决定了机器学习的上限,模型和算法最多只能逼近该上限。此外,决定模型质量的,不是高深的算法和精密的模型,而是高质量的标注数据。
?
孙立英教授强调,“尤其是临床领域的数据,在具有覆盖广度的同时,还要具有专业的深度。例如,CDE对药品数据的要求就是全面、真实、可溯。如何获取这些专业的数据?我们可以从NCDB、NPCR、SEER、CDC、GeneBank等免费向全球开放的数据库中,获得标准化、国际化、电子化、长期化、稳定化的高质量数据。这些国家级数据库背后蕴含着国家法令、国家预算、国家团队、国家资产,所以具有长期、可靠、稳定的特性。此外,这些数据库采用国际标准、国际代码、国际传播,因此还具有全球互通互联、无法造假等优势。”
为什么这些国家级数据会向全球公开?因为这些国家机构是执法单位,被严禁用数据盈利,但其制定了数据标准并使之国际化,使其数据可在全球通用。这一方面促进了这些国家机构的品牌和信誉及其全球影响力,也说明没有数据标准的数据,是数据孤岛;没有根据这些数据标准制定的数据代码所采集到的非数值化数据,无法实现全球性数据互通和互联。即,不采用国际通用数据标准的数据,价值不大。
此外,根据国际标准采集的临床数据,具有极大的专业宽度和深度。只有汇集各界高端人才,让AI与临床跨界合作,才能够得到多个维度、专业深度、与时俱进的临床数据。临床数据标准包括肿瘤分型、分级和分期。例如,肿瘤恶性级别和程度,是医生诊断和治疗的重要依据,也关系着患者临床经过和复发及预后。在这方面,我们可以参考全球最权威、最全面、最稳定、最及时、最可靠的NCCN癌症诊疗指南。但该指南的内容细致丰富且定期会更新,大多数适应症的指南动辄几百页。面对这种时常更新的“大部头”书籍,使用大量人力去阅读掌握,显然不是一个好方法。
?
孙立英教授讲述,“基于AI技术,我们可以更好地利用这些公开的、庞大的标记数据。一方面,AI可以基于这些标注数据,进行预测、判断、评审;另一方面,AI可以在医院植入诊疗指南、诊疗标准,缩小医院和医生之间的差异,让区县乡镇医院也能够及时触达最新的诊疗标准;此外,AI还能够直接To C,为患者提供个性化的诊疗方案。”
?
孙立英教授继续举例,“在临床与患者端,基于AI技术,可以建立多模态专病诊疗个体化AI系统,在疾病、饮食、睡眠、锻炼、康养等维度为患者提供个体化诊疗。在临床医院端,基于AI技术,可以打造专病/多发病、多学科疾病诊断的AI治疗系统。在药品和医疗器械端,AI技术可以应用于药物发现、处方、工艺、生产、质控、质保、申报、上市评估、销售等各个环节。总而言之,AI与临床的联动,可以挖掘出无限的商机从而完成巨大的使命。”
?
AI时代的创新是革命性创新,必须由生态上下游合作伙伴和企业客户携手共进才能实现快速突破。2025 AI For Life Science 智能体创新峰会上,水木分子作为生命健康领域大模型的探索者,与长春金赛药业有限责任公司、凯莱英临床(凯诺)、苏州晟然为安医药科技有限公司、天津市药物临床研究技术创新中心、上海序祯达生物科技有限公司、钉钉(中国)信息技术有限公司进行了战略合作签约,共同探索和加速AI在生命健康领域的突破创新。
?
2025 AI For Life Science 智能体创新峰会上,水木分子还与成都先导药物开发股份有限公司、北京英飞智药科技有限公司、嘉华药锐DeepKinase、药渡智慧(北京)医药科技有限公司等战略合作成立了“AI生物医药源头创新联合体”,该联合体将致力于将人工智能融入药物研发最具挑战性的前端,助力筛选最优的靶点、最优的分子,加速新药的开发。
?
同时,在此峰会上, 水木分子宣布与北京博奥晶方生物科技有限公司、美年大健康产业(集团)有限公司、成都升泷科技有限公司、美国健康产业集团等战略合作成立了“AI中医药大健康联合体”,该联合体将以AI大模型为枢纽,融合基因-蛋白组学筛查、中医证候智能解析、跨国健康数据联动,打造“早筛预警-靶向干预-智慧诊疗-全病程管理”的闭环生态,让前沿算法与千年医学智慧共铸精准健康新范式。
?
?
金赛药业数研院院长鲜翾博士(左)和水木分子首席运营官邢杰先生(右)代表双方签署战略合作协议。金赛将携手水木分子共同打造AI大模型驱动的RDSS一站式药物研发全流程智能决策平台。
?
?
凯莱英凯诺 副总裁/数统负责人路璐女士(左)和水木分子首席运营官邢杰先生(右)代表双方签署战略合作协议。凯莱英临床(凯诺)与水木分子将在临床方案撰写、药物警戒、临床报告等临床核心场景,通过AI大模型建立AI赋能药物开发的临床新范式。
?
?
晟然为安CEO王旭红女士(左)和水木分子首席运营官邢杰先生(右)代表双方签署战略合作协议。晟然为安的资深业务团队与水木分子科技人工智能专家达成深度协同,双方将共同研发医药专利垂直领域大模型,致力解决医药专利布局和检索分析中的核心痛点和难点,为行业提供高效率、高价值的解决方案。
?
?
天津药物临床研究技术创新中心副主任路璐女士(左)和水木分子首席运营官邢杰先生(右)代表双方签署战略合作协议。天津药物临床研究技术创新中心将与水木分子在全国各大三甲医院与医疗机构建立合作,积极探索并落地AI大模型在临床研究中的合规应用。
?
?
序祯达生物创始人兼CEO孙乐乐博士(右)和水木分子首席运营官邢杰先生(左)代表双方签署战略合作协议。序祯达生物与水木分子将围绕“多维度数据智能分析与转化医学应用、药物研发智能化升级、干湿实验闭环驱动的技术范式革新”共同打造AI大模型赋能生物医药研发全周期的数智化解决方案。 ?
?
?
钉钉大健康负责人韦亚伟先生(右)和水木分子首席运营官邢杰先生(左)代表双方签署战略合作协议。在医药垂直领域,钉钉将深度携手水木分子,共同深耕生物医药研发、临床、商业化等AI移动数智化解决方案。
?
?
“AI赋能的源头创新联合体”签约仪式:水木分子联席首席科学家李秀艳博士(中)、成都先导创新战略副总裁窦登峰博士(左一)、英飞智药CSO裴剑锋博士(右一)、嘉华药锐CBO肖云博士(右二)、药渡经纬CEO丁红霞博士(左二)代表联合体单位上台签约。联合体将致力于将人工智能融入药物研发最具挑战性的前端,助力筛选最优的靶点、最优的分子,加速新药的开发。
?
?
“大模型赋能中医药大健康联合体”签约仪式:水木分子联席首席科学家李秀艳博士(中)、北京博奥晶方董事长杨越先生(左一)、美年大健康董事长俞熔先生(左二)、智飞生物及沃森生物联合创始人兼成都升泷科技董事长刘俊辉先生(右二)、美国健康产业集团中国业务首席Helen张女士(右一)联合上台,共同开启“AI+中医药大健康创新联合体”。五方将以AI大模型为枢纽,融合基因-蛋白组学筛查、中医证候智能解析、跨国健康数据联动,打造“早筛预警-靶向干预-智慧诊疗-全病程管理”的闭环生态,让前沿算法与千年医学智慧共铸精准健康新范式。