人工智能设计 DNA 开关,精确控制细胞基因表达
一项由杰克逊实验室、麻省理工学院、哈佛大学布罗德研究所和耶鲁大学的研究人员共同完成的研究,利用人工智能设计了数千个新的 DNA 开关,可以精确控制基因在不同细胞类型中的表达。这项突破性研究发表在《自然》杂志上,为控制基因在体内的表达开辟了前所未有的可能性,并有望在人类健康和医学研究领域带来革命性的改变。
基因编辑技术的进步使科学家能够改变活细胞内的基因,但精确控制基因在特定细胞类型或组织中的表达一直是一个巨大的挑战。 这部分源于对控制基因表达的 DNA 开关,即顺式调控元件 (CRE) 的理解有限。CRE 就像基因的开关,决定了基因何时何地表达,并协调组织身份、发育时间和刺激反应。
为了克服这一挑战,研究团队开发了一个名为 Malinois 的深度卷积神经网络 (CNN),用于预测任何序列的细胞类型相关信息 CRE 活性。 他们还创建了一种名为 CODA 的方法,可以从头设计新型合成 CRE,从而在特定细胞类型中驱动基因表达。
CODA 的关键在于整合了三个关键要素:
- 跨细胞类型建模调控语法: 团队利用机器学习来理解 CRE 的“语法”,即它们如何控制基因表达。
- 高效序列空间搜索: 他们开发了一种算法,可以快速有效地搜索数千种可能的 CRE 序列。
- 可并行验证数千个 CRE 的 MPRA 实验系统: 他们使用了一种高通量实验方法来测试合成 CRE 的功能。
通过整合这些要素,研究人员能够设计出数千个新的合成 CRE,这些 CRE在三种转化细胞系中表现出显著的细胞类型特异性。 他们还证明了这些合成 CRE 在小鼠和斑马鱼的生理相关组织中也能发挥作用。
这项研究的意义在于它为精确控制基因表达开辟了新的可能性。 这将为开发针对特定细胞类型的治疗方法提供新的途径,例如治疗癌症、遗传疾病和感染。此外,这项技术还将为生物制造和医学研究提供新的工具。
该研究的共同通讯作者 Ryan Tewhey 博士说:“这些合成设计的元素的特别之处在于,它们对其设计的目标细胞类型表现出了显著的特异性。这为我们创造了机会,让我们可以在不影响身体其他部位的情况下,仅在一种组织中提高或降低基因的表达。”
这项研究标志着基因编辑技术发展的一个重要里程碑。 人工智能的应用为我们理解和控制基因表达提供了前所未有的能力,这将为未来医学研究和治疗带来巨大潜力。
参考文献:
- Castro, R., Gosai, S., Reilly, S. M., et al. (2024). Machine-guided design of cell-type-targeting cis-regulatory elements. Nature, 633, 101-108.
Views: 0