类GPT化学语言模型,9秒生成100种化合物,微软AI药物设计平台登Nature子刊
人工智能正在彻底改变药物研发领域,而生成式药物设计则为这一变革带来了新的可能性。 传统的药物研发依赖于现有的分子框架和模板,而生成式药物设计则可以从零开始创建全新分子或化合物,为药物研发开辟了全新的思路。然而,现有的生成式药物设计方法往往局限于狭窄的药物相关特性,无法有效提高药物发现的成功率。
为了克服这一挑战,微软研究院科学智能中心、中国科学技术大学和全球健康药物研发中心(GHDDI)合作开发了 AI药物设计平台 TamGen。 TamGen 采用类似 GPT 的化学语言模型方法,通过基于 Transformer 自注意力机制的生成式 AI 模型,实现了针对致病靶蛋白的分子精准生成、优化以及合成与生物实验验证。
TamGen 的核心在于其独特的“交叉注意力机制”。 不同于传统的生成式模型,TamGen 在生成新的化学分子时,能够同时考虑致病靶蛋白的信息。这使得 TamGen 能够基于靶蛋白活性位点信息精准生成具备潜在相互作用的分子,从而增强分子生成的靶向性以及药物设计的合理性与精准度。
研究证明 TamGen 生成的化合物具有更好的分子质量和活性。 将 TamGen 集成到药物发现流程中,研究团队确定了 14 种对结核杆菌 ClpP 蛋白酶表现出显著抑制活性的化合物。其中,最有效的化合物显示出半数最大抑制浓度(IC50)为 1.9 μM。
TamGen 的高效性也令人印象深刻。 与其他方法相比,TamGen 的效率最高,平均仅需 9 秒即可生成100 种化合物。这使得 TamGen 比其他方法快了数十倍,极大地加速了药物发现过程。
GHDDI 中心主任丁胜表示:「TamGen 的初步成果标志着生成式药物设计领域的一项重要创新,为未来的 AI 药物研发提供了强有力的实用性和适用性证据。 随着人工智能技术在药物发现领域的持续进步,TamGen 有望加速新药研发,帮助应对包括结核病在内的多种公共卫生挑战。」
这项研究发表在《Nature Communications》上,为生成式药物设计领域带来了新的突破。 TamGen 的成功表明,人工智能技术正在以前所未有的方式推动药物研发领域的革新,为人类健康带来新的希望。
参考文献:
- TamGen: drug design with target-aware molecule generation through a chemical language model. Nature Communications, 2024. https://www.nature.com/articles/s41467-024-53632-4
Views: 0