北京 – 2025年2月21日 – 人工智能与生物医药的融合正加速推进。继2023年合作推出开源可商用多模态生物医药大模型BioMedGPT后,清华大学人工智能产业研究院(AIR)与北京水木分子生物科技有限公司(水木分子)今日再度携手,发布了升级版的生物医药多模态开源基础大模型BioMedGPT-R1。
这一举措正值DeepSeek在全球范围内引发新一轮AI大模型热议之际。市场咨询公司普遍认为,DeepSeek的出现将推动AI产业生态从大模型供应商到基础设施和平台供应商的全面升级。DeepSeek R1以其强大的推理能力,为各行各业的智能化转型带来机遇,而生物医药领域,也正迎来它的“DeepSeek时刻”。
BioMedGPT-R1:DeepSeek赋能的生物医药新引擎
BioMedGPT-R1的核心在于,它采用了DeepSeek R1的蒸馏版本模型,替换了原BioMedGPT中的文本基座模型,从而显著提升了文本推理能力。通过跨模态特征对齐,BioMedGPT-R1实现了生物模态与自然语言文本模态在同一特征空间的融合,探索了生物多模态场景下的深度推理能力。
具体而言,BioMedGPT-R1通过训练对齐翻译层(Translator),将生物模态编码器(Molecule Encoder 与 Protein Encoder)输出映射到自然语言表征空间,从而使模型在DeepSeek R1的基础上具备了理解生物模态数据的能力。
技术细节:跨模态对齐与深度推理
BioMedGPT-R1的训练过程主要分为两个步骤:
- 对齐翻译层训练: 首先,仅训练对齐翻译层,使其能够将编码后的生物模态表征映射到语义表征空间。
- 联合微调: 然后,同时微调对齐翻译层和基座大语言模型,激发其在下游任务上的多模态深度推理能力。
以化学小分子为例,BioMedGPT-R1首先通过化学分子编码器提取特征,生成中间表示,然后通过对齐翻译层进行映射,得到化学分子表征,最终与经过处理和编码的语言指令表征共同输入至基座语言模型,使语言模型能够结合两个模态信息进行综合推理,生成最终的文本回复。
应用前景:赋能药物研发与生物医药行业
基于上述模型架构与训练策略,BioMedGPT-R1支持跨模态自然语言和生物语言的交互式问答推理,可应用于药物分子深度理解分析、药物靶点探索与挖掘等领域。例如,当需要了解某个化学分子时,BioMedGPT-R1可以从分子结构、官能团组成、生化性质和可能的应用等方面逐步推理分析,最终形成文本回复。
清华大学AIR和水木分子研究团队表示,他们将持续维护OpenBioMed开源平台,并以BioMedGPT-R1为基础进行系统性研究与综合评估。初步结果显示,BioMedGPT-R1在化学分子理解任务上的性能已得到显著提升,例如在CheBI-20化学分子描述任务上相比上一版本效果提升超过15%。
开源与商业“双管齐下”
值得一提的是,DeepSeek版ChatDD-R1基座模型也已同步上线水木分子的AI驱动药物发现工具ChatDD,赋能生物医药企业的药物研发。
清华大学AIR与水木分子的合作,不仅推动了开源生物医药大模型的发展,也加速了AI技术在药物研发领域的应用。BioMedGPT-R1的发布,标志着生物医药领域正迎来由AI驱动的深刻变革。
参考文献
- 清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1. (2025, February 21). 机器之心. Retrieved from 链接
- BioMedGPT: A Multimodal Biomedical Foundation Model. (2023). 清华大学AIR & 水木分子.
关键词: BioMedGPT-R1, DeepSeek, 人工智能, 生物医药, 多模态大模型, 开源, 药物研发, 清华大学AIR, 水木分子.
Views: 0