华盛顿特区 — 面对生物医学研究领域科学文献和数据爆炸式增长的挑战,一种名为 iKraph 的新型大规模生物医学知识图谱(KG)应运而生。由佛罗里达州立大学和 Insilicom LLC 的研究人员联合开发,iKraph 利用人工智能技术,实现了人类专家级别的准确性,为药物研发和疾病治疗带来了新的希望。
知识图谱作为整合大量异构数据、实现高效信息检索和自动知识发现的关键工具,在生物医学研究中扮演着越来越重要的角色。然而,将非结构化的科学文献转化为知识图谱一直面临着巨大的挑战,以往的方法难以达到人类水平的准确率。
iKraph 的突破在于,研究团队采用了在 LitCoin 自然语言处理挑战赛 (2022) 中获得第一名的信息提取流程,该流程能够从所有 PubMed 摘要中提取信息,并与人类专家注释相匹配。为了增强知识图谱的全面性,研究团队还整合了来自 40 个公共数据库的关系数据,以及从高通量基因组学数据推断出的关系信息。
这项研究成果于 2025 年 3 月 17 日发表在《Nature Machine Intelligence》杂志上,题为 A comprehensive large-scale biomedical knowledge graph for AI-powered data-driven biomedical research。
iKraph 的优势:
- 迄今为止最大最全面: iKraph 整合了来自多个来源的海量数据,成为目前为止构建的最全面的生物医学知识图谱。
- 人类专家级准确性: 通过手动验证,iKraph 的信息提取流程被证实拥有人工注释者级别的准确性,保证了数据的质量。
- 因果推理能力: iKraph 能够进行间接因果推理,帮助研究人员发现隐藏在数据中的关联,从而更深入地理解生物医学现象。
- 药物再利用潜力: iKraph 在药物靶标识别和药物再利用领域具有关键作用。研究团队通过实验证明了 iKraph 在 COVID-19、囊性纤维化等疾病的药物再利用方面的强大功能。
iKraph 的应用前景:
iKraph 的出现有望彻底改变生物医学研究的方式,加速药物研发的进程。它不仅可以帮助研究人员更高效地检索信息,还可以用于:
- 药物靶标识别: 通过分析 iKraph 中的数据,研究人员可以发现新的药物靶标,为新药的开发提供方向。
- 药物再利用: iKraph 可以帮助研究人员发现已上市药物的新用途,从而更快地找到治疗疾病的方法。
- 个性化医疗: 通过整合患者的基因组数据和临床信息,iKraph 可以为患者提供个性化的治疗方案。
挑战与展望:
尽管 iKraph 具有诸多优势,但也面临着一些挑战。例如,大型语言模型(LLM)的知识截止日期是固定的,这限制了它们对最新发展的了解。因此,在生物医学研究中,仅依靠 LLM 来回答特定问题可能会出现不准确的风险。
未来,研究人员需要不断更新 iKraph 的数据,并探索新的方法来提高其准确性和推理能力。随着人工智能技术的不断发展,iKraph 有望在生物医学研究领域发挥更大的作用,为人类健康做出更大的贡献。
参考文献:
- A comprehensive large-scale biomedical knowledge graph for AI-powered data-driven biomedical research. Nature Machine Intelligence, Published: 17 March 2025.
致谢:
感谢佛罗里达州立大学和 Insilicom LLC 的研究人员为 iKraph 的开发所做出的贡献。
Views: 0