上海宝山炮台湿地公园的蓝天白云上海宝山炮台湿地公园的蓝天白云

中国科大突破性蛋白质设计方法:无需预训练,媲美天然蛋白

引言: 生命科学领域长期以来面临着一个巨大的挑战:如何从头设计具有特定功能的蛋白质。这就好比用乐高积木搭建一座复杂的摩天大楼,不仅需要精确的图纸,还需要保证这座大楼的稳定性和功能性。近日,中国科学技术大学的研究团队在这一领域取得了突破性进展,他们开发了一种无需预训练的蛋白质设计方法,其生成的蛋白质亲和力与天然蛋白相当,研究成果发表在《Nature Methods》期刊上。这项研究不仅为药物研发、生物材料设计等领域带来了新的可能性,也为人工智能在生命科学领域的应用树立了新的里程碑。

主体:

中国科学技术大学生命科学与医学部刘海燕教授和陈泉教授团队开发的 SCUBA-diffusion(SCUBA-D)模型,是一种基于去噪扩散概率模型(DDPM)的蛋白质主链设计方法。不同于以往依赖于预训练结构预测模型(如RoseTTAFold)的蛋白质设计方法,SCUBA-D 实现了“从零开始”的设计,避免了继承预训练模型潜在偏差的风险。

1. 突破性技术: SCUBA-D 的核心在于其创新的训练策略。该模型通过考虑序列表示的共扩散进行新训练,并增强了模型正则化和对抗性损失,从而最大限度地减少了数据分布外误差。这有效解决了以往 DDPM 在蛋白质结构设计中难以生成可实验验证的无缺陷结构的难题。

2. 性能卓越: 在生成实验可实现的蛋白质结构方面,SCUBA-D 的性能与基于预训练 RoseTTAFold 的 RFdiffusion 相当,甚至更胜一筹。它能够轻松生成尚未观察到的、整体折叠与 RoseTTAFold 可预测折叠不同的蛋白质结构,展现了其强大的生成能力和创新性。

3. 实验验证: 研究团队对 SCUBA-D 的准确性进行了严格的实验验证。他们设计了 16 种蛋白质和一种蛋白质复合物,并通过 X 射线晶体结构分析证实了 SCUBA-D 设计的蛋白质结构与目标结构高度一致(主链原子位置均方根位移在 0.96 到 2.11Å之间)。此外,他们还验证了设计出的血红素结合蛋白和 Ras 结合蛋白的结合能力,其中部分蛋白的亲和力与天然蛋白相当甚至更高。这些实验结果有力地证明了 SCUBA-D 方法的可靠性和高效性。

4. 应用广泛: SCUBA-D 能够完成多种蛋白质设计任务,包括无条件生成、基于草图输入的生成以及生成具有特定功能(如结合小分子或其他蛋白质)的主链结构。这为设计各种具有特定功能的蛋白质提供了强大的工具,例如用于药物靶向治疗的药物分子、具有特定催化活性的酶以及用于生物材料工程的结构蛋白。

5. 意义深远: 这项研究不仅为蛋白质设计领域带来了革命性的变化,也为人工智能在生命科学领域的应用提供了新的思路。通过解决数据分布误差等关键问题,SCUBA-D 证明了深度生成模型可以有效地扩展到蛋白质结构等复杂的物理对象,为未来蛋白质设计和药物研发提供了强大的新工具。

结论:

中国科大团队开发的 SCUBA-D 模型标志着蛋白质从头设计领域的一项重大突破。其无需预训练、高精度、高效率以及广泛的应用前景,为药物研发、生物材料设计等领域带来了前所未有的机遇。这项研究也为人工智能与生命科学的深度融合提供了新的范例,预示着未来人工智能将扮演越来越重要的角色,推动生命科学领域取得更多突破性进展。 未来的研究方向可以集中在进一步提高 SCUBA-D 的效率和精度,以及探索其在更复杂蛋白质系统(例如膜蛋白)设计中的应用。

参考文献:

(待补充:由于我没有访问互联网的能力,无法提供具体的参考文献链接。请根据文章中提到的论文标题“De novo protein design with a denoising diffusion network independent of pretrained structure prediction models” 在《Nature Methods》期刊官网或学术数据库中查找。)


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注