AI助力棉花育种:解析近3亿DNA甲基化数据,找到43个关键基因
湖畔实验室与科研团队合作,利用AI技术破译棉花产量和纤维品质的“密码本”,为棉花育种提供新的思路。
棉花作为全球最大的天然纺织纤维来源,其产量和纤维品质一直是育种家们关注的重点。近年来,随着人工智能(AI)和生物大数据技术的快速发展,农业育种领域也迎来了“智慧育种”的时代。近日,由浙江大学棉花精准育种团队、中国农科院生物技术所和湖畔实验室(阿里巴巴达摩院)智慧育种团队组成的联合科研团队,利用AI技术解析了近3亿个DNA甲基化数据,成功找到了43个可能影响棉花产量和纤维品质的关键基因,为棉花品种改良提供了新的思路。相关研究成果已发表在国际顶级期刊《细胞研究》(Cell Research)上。
DNA甲基化:作物性状的“隐形开关”
DNA甲基化是一种重要的表观遗传修饰,它可以在不改变DNA序列的情况下,影响基因的表达,进而影响作物的性状。研究表明,DNA甲基化在棉花产量、纤维品质、抗逆性等方面发挥着重要作用。
AI加速数据分析,揭示棉花育种新方向
此次研究中,联合科研团队收集了207个棉花品种的全基因组甲基化测序数据、基因组测序数据、转录组测序数据,并结合农艺性状的表型数据,进行关联分析。这项研究规模巨大,仅甲基化测序数据就达到17TB。为了加速海量数据的分析处理,湖畔实验室融合AI和并行计算技术,开发了一套新型算法,将分析计算速度提升近100倍。
破译“密码本”,找到43个关键基因
通过AI技术的加持,联合团队首次构建了群体尺度的棉花全基因组DNA甲基化图谱,涵盖2.87亿个单甲基化多态性(SMP)位点。在此基础上,他们绘制了与棉花纤维发育相关的表观调控网络,并发现了43个潜在参与纤维发育的eQTM基因。其中一个位点已通过基因编辑实验,证实其调控棉花纤维长度的作用。
未来展望:AI助力培育“超级”作物
这项研究成果表明,DNA甲基化数据可以作为育种资源,为棉花品种改良提供新的思路。未来,研究人员将继续利用AI技术,挖掘更多与棉花产量、纤维品质相关的关键基因,并开发更加精准的预测模型,加速培育“超级”作物。
湖畔实验室:智慧育种的“中央厨房”
湖畔实验室(数据科学与应用浙江省实验室)成立于2020年7月,依托阿里巴巴达摩院建设,聚焦数据科学领域的“数据智能”和“新型计算”两大方向。在智慧育种领域,湖畔实验室牵头研发全流程智慧育种平台,为育种家们提供包含育种数据管理和分析、计算加速、AI预测的“中央厨房”,大幅缩短培育新品种的周期。
结语
AI技术的应用,正在加速农业育种领域的变革,为培育高产、优质、抗逆的作物提供新的可能性。相信随着AI技术的不断发展,智慧育种将为人类粮食安全和可持续发展做出更大的贡献。
Views: 1