浙江大学与澳门理工大学等机构的联合研究团队,近日在酶活性位点注释领域取得重大突破。他们研发出一种名为EasIFA的多模态深度学习方法,能够以1400倍的速度提升准确标注酶活性位点,相关研究成果已发表在《Nature Communications》子刊上。
挑战与机遇并存
酶活性位点注释对于药物发现、疾病研究、酶工程和合成生物学等多个领域的发展至关重要。然而,传统的注释方法在速度和准确性之间存在重大权衡,这限制了它们的大规模实际应用。在此背景下,浙大与澳门理工的研究团队致力于寻找一种既能提高注释速度,又能保证准确性的新方法。
EasIFA算法的突破
EasIFA算法融合了来自蛋白质语言模型和3D结构编码器的潜在酶表示,通过多模态交叉注意框架将蛋白质水平信息与酶促反应知识对齐。这种方法在保持注释质量的同时,实现了650到1400倍的速度提升,比传统的BLASTp速度提升10倍。
性能指标全面提升
在SwissProt E-RXN ASA测试集中的实验结果表明,EasIFA在定位活性位点和注释其类型的预测准确度方面,优于所有基准算法。召回率、准确率、f1分数和MCC分别提升7.57%、13.08%、9.68%和0.1012。这一成果显示出EasIFA在酶活性位点注释领域的巨大潜力。
迁移学习增强模型能力
为了克服不同数据库中相同酶活性位点的注释趋势和标准的显著差异,研究团队采用了迁移学习的方法。这使得在大型、粗略注释的数据库上训练的模型,可以转移到较小的、精细注释的数据集上。这一方法进一步增强了EasIFA模型的预测能力。
应用前景广阔
EasIFA算法不仅速度快,准确度高,还显示出作为催化位点监测工具的潜力。它可用于设计具有超出其自然分布所需功能的酶,为药物设计、疾病机制阐明和酶工程等领域提供了新的工具。
结语
总体而言,EasIFA算法有望取代业界和学术界常用的标准注释工具,为研究人员提供一种高效、准确的酶活性位点注释方法。这一成果的发表,标志着我国在酶活性位点注释领域取得了重要进展,为相关领域的研究提供了新的思路和工具。
“`markdown
相关链接
- EasIFA网络服务器计算工具:http://easifa.iddd.group
- 论文原文:https://www.nature.com/articles/s41467-024-40245-9
“`
Views: 0