shanghaishanghai

AI助力蛋白质工程:清华团队开发几何学习模型,精准预测突变稳定性

蛋白质突变效应的精准预测是蛋白质工程和设计领域的关键问题。近日,清华大学龚海鹏团队开发了一套基于几何学习的模型套件——GeoStab-suite,在蛋白质突变稳定性预测方面取得突破性进展,相关研究成果发表在《Nature Computational Science》上。

GeoStab-suite 包含三个模型:GeoFitness、GeoDDG 和 GeoDTm,分别用于预测蛋白质突变后的适应度得分、ΔΔG 和 ΔTm。

GeoFitness 采用专门的损失函数,能够利用深度突变扫描 (DMS) 数据库中的海量多标记适应度数据进行训练。该模型克服了以往模型需要重新训练的限制,在预测蛋白质适应度方面超越了其他先进方法。

GeoDDG 和 GeoDTm 则利用 GeoFitness的编码器进行预训练,有效地解决了缺乏足够标记数据的挑战。这种预训练策略结合数据扩展,显著提升了模型性能和通用性。在基准测试中,GeoDDG 和 GeoDTm 在 Spearman 相关系数方面分别比其他最先进方法高出至少 30% 和70%。

GeoStab-suite 的优势在于:

  • 几何学习编码器: 利用图注意神经网络架构,将蛋白质序列和结构信息整合到编码器中,更准确地捕捉蛋白质的几何特征。
  • 预训练策略: 利用 GeoFitness 的编码器进行预训练,提高了 GeoDDG 和 GeoDTm 的预测精度。
  • 数据扩展: 通过数据收集和预训练策略,克服了 ΔΔG 和 ΔTm 预测中数据有限的挑战。

GeoStab-suite 的应用前景广阔:

*蛋白质工程: 帮助科学家设计出具有更高稳定性和功能的蛋白质,推动生物技术和生物制药领域的发展。
* 药物研发: 预测蛋白质突变对药物靶点的影响,加速药物研发进程。
* 基础研究: 深入理解蛋白质结构与功能之间的关系,推动蛋白质科学研究的进步。

该研究成果标志着蛋白质工程领域取得了重要进展,为蛋白质设计和改造提供了新的工具和方法。 龚海鹏团队的创新性研究将进一步推动人工智能在生物医药领域的应用,为人类健康和社会发展做出更大的贡献。

论文链接: https://www.nature.com/articles/s43588-024-00716-2

关键词: 蛋白质工程,人工智能,几何学习,突变稳定性,GeoStab-suite,深度学习,蛋白质设计,药物研发


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注