Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

上海的陆家嘴
0

清华大学突破性研究:EvoAI实现蛋白质序列空间极端压缩,开启蛋白质工程新纪元

引言: 想象一下,一个拥有无限可能性的空间,其中每一个点都代表一个蛋白质序列,而我们只关注那些具有特定功能的“宝藏”。寻找这些“宝藏”如同大海捞针,耗时费力。然而,清华大学的研究团队近期在《Nature Methods》发表的论文中,利用EvoAI系统,将这一“大海”压缩至令人难以置信的程度,为蛋白质工程和设计带来了革命性的变革。

主体:

蛋白质是生命的基础,设计功能更佳的蛋白质是生物技术、医学和合成生物学领域的圣杯。然而,蛋白质序列空间的巨大复杂性一直是该领域的主要瓶颈。理解和操纵蛋白质适应度景观——一个高维且复杂的空间,包含着数量惊人的可能序列和功能——是蛋白质工程的核心挑战。 传统的定向进化技术和计算建模方法都存在局限性:前者在精确度和覆盖度之间难以平衡,后者受限于训练数据的可用性,且往往忽略生物学因素。

清华大学的研究团队巧妙地结合了高通量实验和先进的计算方法,开发出名为EvoAI的系统,攻克了这一难题。EvoAI的核心在于其独特的“扫描-重建”策略:

  1. EvoScan:全面的序列空间扫描: 研究人员首先开发了EvoScan方法,一种结合了基于EvolvR的分段诱变系统和噬菌体辅助非连续进化(PANCE)的进化扫描技术。EvoScan能够对高适应度序列空间进行全面分割和扫描,识别出能够捕捉其基本特征的“锚点”。这些锚点就好比地图上的关键坐标点,它们代表了高适应度序列空间中的关键区域。该方法适用于任何能够与转录输出耦合的生物分子功能研究。

  2. 深度学习与大型语言模型:精准的序列空间重建: 研究团队随后利用深度学习和大型语言模型,从EvoScan识别的锚点中准确重建整个高适应度序列空间。这意味着,无需先前的同源性或结构信息,EvoAI就能预测新的、高度拟合的序列。

  3. 极端压缩与高效预测: 将EvoAI应用于阻遏蛋白的实验中,研究人员取得了令人瞩目的成果:仅需82个锚点,就足以压缩高适应度序列空间,压缩率达到了惊人的10\u003csup\u003e48\u003c/sup\u003e。这就好比将一个浩瀚的宇宙压缩成一个微小的原子,极大地提高了蛋白质设计的效率。 实验结果显示,EvoAI设计出的十种蛋白质,活性均显著高于野生型(最高达11倍)。

EvoAI的优势:

与现有方法相比,EvoAI具有以下几个显著优势:

  • 平衡了适应度优化和序列空间的均匀采样: 能够快速探索高维空间,生成更多样化和功能性的蛋白质变体。
  • 结合了实验和计算方法的优势: EvoScan提供实验数据,深度学习模型则进行空间重建和预测,两者相互促进。
  • 适用于多种蛋白质类型和功能: 实验表明,EvoScan能够捕获具有不同功能(蛋白质-蛋白质、蛋白质-配体、蛋白质-核酸相互作用)的蛋白质的锚点,具有广泛的应用前景。

未来展望:

EvoAI的未来发展方向包括:改进EvoScan方法,提高扫描效率和覆盖度;开发更强大的深度学习模型,以更好地理解和预测蛋白质序列-功能关系;将EvoAI应用于更广泛的生物分子和功能研究。

结论:

清华大学团队的EvoAI系统代表了蛋白质工程领域的一次重大突破。其极端压缩蛋白质序列空间的能力,将极大地加速新功能蛋白质的设计和开发,为生物技术、医学和合成生物学等领域带来革命性的影响。 这项研究不仅为蛋白质工程提供了强大的新工具,也为我们理解生命进化机制提供了新的视角。 未来,EvoAI有望在药物研发、工业酶设计、合成生物学等领域发挥巨大作用,开启蛋白质工程的新纪元。

参考文献: (此处应列出论文的完整参考文献,并遵循统一的引用格式,例如APA格式) 由于我没有访问互联网的能力,无法提供具体的参考文献信息。 请读者自行查阅《Nature Methods》期刊,搜索标题为“EvoAI enables extreme compression and reconstruction of the protein sequence space”的论文。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注