Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

shanghaishanghai
0

北京 – 2025年2月21日 – 人工智能与生物医药的融合正加速推进。继2023年合作推出开源可商用多模态生物医药大模型BioMedGPT后,清华大学人工智能产业研究院(AIR)与北京水木分子生物科技有限公司(水木分子)今日再度携手,发布了升级版的生物医药多模态开源基础大模型BioMedGPT-R1。

这一举措正值DeepSeek在全球范围内引发新一轮AI大模型热议之际。市场咨询公司普遍认为,DeepSeek的出现将推动AI产业生态从大模型供应商到基础设施和平台供应商的全面升级。DeepSeek R1以其强大的推理能力,为各行各业的智能化转型带来机遇,而生物医药领域,也正迎来它的“DeepSeek时刻”。

BioMedGPT-R1:DeepSeek赋能的生物医药新引擎

BioMedGPT-R1的核心在于,它采用了DeepSeek R1的蒸馏版本模型,替换了原BioMedGPT中的文本基座模型,从而显著提升了文本推理能力。通过跨模态特征对齐,BioMedGPT-R1实现了生物模态与自然语言文本模态在同一特征空间的融合,探索了生物多模态场景下的深度推理能力。

具体而言,BioMedGPT-R1通过训练对齐翻译层(Translator),将生物模态编码器(Molecule Encoder 与 Protein Encoder)输出映射到自然语言表征空间,从而使模型在DeepSeek R1的基础上具备了理解生物模态数据的能力。

技术细节:跨模态对齐与深度推理

BioMedGPT-R1的训练过程主要分为两个步骤:

  1. 对齐翻译层训练: 首先,仅训练对齐翻译层,使其能够将编码后的生物模态表征映射到语义表征空间。
  2. 联合微调: 然后,同时微调对齐翻译层和基座大语言模型,激发其在下游任务上的多模态深度推理能力。

以化学小分子为例,BioMedGPT-R1首先通过化学分子编码器提取特征,生成中间表示,然后通过对齐翻译层进行映射,得到化学分子表征,最终与经过处理和编码的语言指令表征共同输入至基座语言模型,使语言模型能够结合两个模态信息进行综合推理,生成最终的文本回复。

应用前景:赋能药物研发与生物医药行业

基于上述模型架构与训练策略,BioMedGPT-R1支持跨模态自然语言和生物语言的交互式问答推理,可应用于药物分子深度理解分析、药物靶点探索与挖掘等领域。例如,当需要了解某个化学分子时,BioMedGPT-R1可以从分子结构、官能团组成、生化性质和可能的应用等方面逐步推理分析,最终形成文本回复。

清华大学AIR和水木分子研究团队表示,他们将持续维护OpenBioMed开源平台,并以BioMedGPT-R1为基础进行系统性研究与综合评估。初步结果显示,BioMedGPT-R1在化学分子理解任务上的性能已得到显著提升,例如在CheBI-20化学分子描述任务上相比上一版本效果提升超过15%。

开源与商业“双管齐下”

值得一提的是,DeepSeek版ChatDD-R1基座模型也已同步上线水木分子的AI驱动药物发现工具ChatDD,赋能生物医药企业的药物研发。

清华大学AIR与水木分子的合作,不仅推动了开源生物医药大模型的发展,也加速了AI技术在药物研发领域的应用。BioMedGPT-R1的发布,标志着生物医药领域正迎来由AI驱动的深刻变革。

参考文献

  • 清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1. (2025, February 21). 机器之心. Retrieved from 链接
  • BioMedGPT: A Multimodal Biomedical Foundation Model. (2023). 清华大学AIR & 水木分子.

关键词: BioMedGPT-R1, DeepSeek, 人工智能, 生物医药, 多模态大模型, 开源, 药物研发, 清华大学AIR, 水木分子.


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注