shanghaishanghai

引言

在蛋白质设计的领域,序列与结构的协同生成一直是科研人员追求的目标。近日,华盛顿大学David Baker团队在《Nature Biotechnology》上发表了一项突破性研究,提出了一种基于RoseTTAFold的序列空间扩散模型ProteinGenerator (PG),该模型能够同时生成蛋白质序列和结构。这一创新性成果为蛋白质功能的计算和实验优化开辟了新的途径。

主体

研究背景

蛋白质去噪扩散概率模型(DDPM)在蛋白质主链生成方面展现出巨大潜力,但在生成具有序列特异性和功能特性的蛋白质方面存在局限。为了克服这一限制,David Baker团队开发了PG模型,该模型在序列空间中操作,能够生成满足特定序列和结构属性的蛋白质。

PG模型的工作原理

PG模型从噪声序列表示开始,通过迭代去噪生成序列和结构对。它利用RoseTTAFold结构预测网络,将输入的序列和结构信息映射到输出的序列和结构上。这种方法允许研究人员在序列空间中直接设计蛋白质,从而更有效地指导蛋白质的功能特性。

设计多状态和功能蛋白

PG模型能够生成具有不同氨基酸组成和内部序列重复的耐热蛋白质和笼状生物活性肽,如蜂毒肽。研究团队通过实验验证了PG设计的蛋白质,证明了其能够在PDB训练分布之外推理序列结构关系。

富含稀有氨基酸的蛋白质设计

PG模型在生成富含稀有氨基酸的蛋白质方面表现出色,这些蛋白质具有与天然蛋白质截然不同的序列,但能够折叠成稳定的结构。

序列重复蛋白设计

PG模型能够轻松适应生成序列重复蛋白,通过给定重复单元的序列长度和重复次数,模型能够在每个时间步长上应用重复对称性。

生物活性肽笼设计

PG模型还能设计出活性取决于外部输入的蛋白质,这对于治疗剂和生物传感器的设计具有重要意义。

结论

David Baker团队开发的PG模型标志着蛋白质设计领域的一个重要进步。通过在序列空间中进行扩散,PG模型不仅提高了蛋白质设计的准确性和多样性,还为未来蛋白质功能的综合计算和实验优化提供了强大的工具。这一成果有望推动蛋白质工程和相关应用的发展,为生物医药、农业和环境保护等领域带来新的突破。

参考文献:
– Multistate and functional protein design using RoseTTAFold sequence space diffusion. Nature Biotechnology, 2023. Link


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注