北大陈语谦团队开发深度学习方法,实现多模态单细胞数据整合与插补
北京大学信息工程学院、化学生物学与生物技术学院省部共建肿瘤化学基因组学国家重点实验室、鹏城国家实验室合聘研究员和 AI4S 平台中心主任陈语谦教授团队,近日在《Nature Communications》发表论文,提出了一种名为 Monae 的新型深度学习方法,能够有效地整合和插补不配对的多模态单细胞数据。
背景:多模态单细胞数据分析的挑战
单细胞测序技术近年来取得了巨大进步,可以对单个细胞的基因表达、蛋白质组、表观遗传等信息进行分析,为研究细胞异质性提供了前所未有的机会。然而,多模态单细胞数据分析面临着诸多挑战,例如不同模态数据之间的异构特征空间和技术噪声,以及跨模态获取配对数据的高成本。
Monae:一种新型的多模态整合方法
为了解决这些挑战,陈语谦教授团队开发了 Monae,一种基于深度学习的多模态整合方法。Monae 的核心思想是通过联结不同模态之间的关系,并采用对比学习来增强联合空间中的细胞表示。
Monae 的主要特点:
- 模态联结: Monae 将不同模态的数据映射到一个共同的潜在空间,从而建立起模态之间的关系。
- 对比学习: Monae在特定模态中采用对比学习,通过比较不同细胞之间的相似性和差异性来增强联合空间中的细胞表示。
- 整合与插补: Monae 的整合部分提供模态互补的细胞表示,插补部分利用细胞表示生成具有生物异质性的模态内和跨模态计数。
- Monae-E: Monae 的一种变体,支持更快收敛并提供可解释性。
研究结果:
研究团队在各种数据集上评估了 Monae 的性能,结果表明 Monae 在整合和插补不配对的多模态单细胞数据方面表现出色,优于现有的其他方法。
意义:
Monae 的开发为多模态单细胞数据分析提供了新的工具,可以促进对细胞异质性的深入研究。该方法的应用可以帮助研究人员更好地理解细胞功能、疾病机制和药物作用机制。
未来展望:
陈语谦教授团队表示,他们将继续改进 Monae,并将其应用于更广泛的生物学研究领域,例如癌症研究、免疫学研究和神经科学研究。
参考文献:
- Chen, Y., et al. (2024). Monae: A multimodal single-cell data integration and imputation method based on deep learning. Nature Communications, 15, 53355.
作者:
ScienceAI
日期:
2024年10月21日
关键词:
单细胞数据,多模态,深度学习,整合,插补,Monae,陈语谦,北京大学
Views: 0