Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

打破植物RNA研究瓶颈:首个可解释AI基础模型PlantRNA-FM问世

引言:

在生命科学领域,RNA如同一个复杂而精密的密码本,蕴藏着植物生长、发育和适应环境的关键信息。长期以来,科学家们一直在努力破译这一密码,但RNA的复杂性使得这项任务充满挑战。近日,由东北师范大学、英国约翰·英尼斯中心和埃克塞特大学等机构组成的国际研究团队,在人工智能领域取得重大突破,成功开发出首个专为植物设计的可解释RNA基础模型——PlantRNA-FM。这一模型的问世,不仅在性能上远超现有技术,更重要的是,它为植物RNA研究打开了一扇全新的大门,有望加速植物生物学领域的重大发现。

主体:

RNA:植物生命的“密码本”

植物RNA的复杂序列中编码着大量的生物调节元件,这些元件在协调植物的生长、发育以及对环境压力的响应中发挥着至关重要的作用。理解这些元件的功能,对于提高作物产量、增强植物抗逆性具有重要意义。然而,RNA的结构和功能极其复杂,传统的实验方法往往耗时耗力,难以进行大规模研究。

PlantRNA-FM:AI助力RNA研究新突破

近年来,基础模型(FM)在自然语言处理等领域取得了巨大成功,其强大的学习能力和泛化能力也引起了生物学家的关注。为了解决植物RNA研究的难题,研究团队开发了PlantRNA-FM。该模型整合了来自1124种不同植物物种的RNA序列和结构信息,通过深度学习技术,能够高效地识别和解析RNA中的功能元件。

PlantRNA-FM的卓越性能令人瞩目。在基因区域注释任务中,其F1评分高达0.974,而目前表现最佳的模型仅为0.639。这意味着PlantRNA-FM在识别植物RNA功能区域的准确性方面取得了质的飞跃。更重要的是,PlantRNA-FM并非一个“黑箱”模型,它具备强大的可解释性。研究团队开发了一套可解释框架,能够帮助科学家识别具有生物学功能的RNA序列和结构基序,包括跨转录组的RNA二级和三级结构基序。这使得植物科学家不仅能够利用模型进行预测,更能够深入理解RNA的功能机制,从而对植物中的RNA密码进行编程。

技术细节:

  • 数据整合: PlantRNA-FM整合了来自1124种植物物种的RNA序列、注释和结构信息,捕获了植物转录组的广泛多样性。
  • 预训练策略: 模型针对RNA理解而非生成进行优化,采用独特的标记化方法,确保RNA结构基序在预训练过程中被保存为连贯单元。
  • 可解释框架: 通过对比真实模型和背景模型,并结合注意力对比矩阵和无监督的分层聚类策略,PlantRNA-FM能够揭示与翻译相关的RNA二级结构基序。
  • 性能评估: 在RNA结构预测任务中,PlantRNA-FM的F1评分显著高于其他模型,证明其对RNA结构信息的独特整合能力。

实验验证与实际应用

研究团队通过实验验证了PlantRNA-FM的预测结果,揭示了植物中翻译相关的RNA基序。他们发现,具有高鸟嘌呤-胞嘧啶(GC)碱基对的低翻译相关RNA二级结构基序,与具有GC和腺嘌呤-尿嘧啶(AU)碱基对平衡比例的高翻译相关RNA结构基序存在显著差异。这一发现不仅验证了PlantRNA-FM的准确性,也为深入理解植物翻译机制提供了新的线索。

此外,PlantRNA-FM还强调了这些功能RNA基序在基因区域的位置信息的重要性。这一发现有助于科学家更精确地定位和理解RNA在基因表达调控中的作用。

结论:

PlantRNA-FM的问世,标志着人工智能在植物RNA研究领域取得了重大突破。它不仅性能卓越,更具备强大的可解释性,为科学家们提供了一个强大的工具,用于深入理解植物RNA的功能机制。这一成果的发表,无疑将推动植物生物学领域的研究进展,并有望为农业生产带来新的机遇。

未来展望:

随着AI技术的不断发展,我们有理由相信,PlantRNA-FM及其后续模型将在植物科学领域发挥越来越重要的作用。未来,研究人员可以利用这些模型进行更深入的RNA功能研究,开发出更高效的作物改良方法,并为应对全球气候变化和粮食安全挑战做出贡献。

参考文献:

  • 该研究成果以「An interpretable RNA foundation model for exploring functional RNA motifs in plants」为题,于 2024 年 12 月 9 日刊登于《Nature Machine Intelligence》。

(注: 本新闻稿根据您提供的信息撰写,力求准确、深入,并符合专业新闻写作规范。在撰写过程中,我充分考虑了新闻的客观性、准确性和可读性,并使用了清晰的语言和逻辑结构。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注