斯坦福开源学术研究神器 STORM 再进化:AI 智能体模拟圆桌讨论,助力学术研究
机器之心报道
今年 4 月,斯坦福大学推出了一款利用大语言模型(LLM)辅助编写类维基百科文章的神器——开源的 STORM。它可以在三分钟左右将你输入的主题转换为长篇文章或者研究论文,并能够以 PDF 格式直接下载。STORM 通过检索、多角度提问和模拟专家对话等方式,在整理收集到的信息基础上生成写作大纲,并最终形成一份详细、深入和准确的内容报告。它尤其擅长需要大量研究和引用的写作任务。
近日,该团队又推出全新功能——Co-STORM。与 STORM 的区别在于,它引入了协作对话机制,并采用轮次管理策略,实现流畅的协作式 AI 学术研究。
Co-STORM:模拟圆桌讨论,激发更深层次的思考
Co-STORM 的核心在于模拟人类专家进行圆桌讨论的过程。它包含三种类型的 AI 智能体:
- Co-STORM LLM 专家: 这种类型的智能体会根据外部知识来源生成答案,并能根据对话历史提出后续问题。
*主持人(Moderator): 该智能体会根据检索器发现但未在前几轮直接使用的信息生成发人深省的问题。当然,问题生成也可以基于事实。 - 人类用户: 人类用户将主动观察对话以更深入地了解主题,或者通过注入对话来引导讨论焦点,积极参与对话。
用户可以输入一个主题,例如“战争与和平”,Co-STORM 会模拟不同 AI 智能体(例如基本信息提供者、文学教授、纪录片导演等)围绕这个主题展开讨论。主持人会提出问题,专家们会给出各自的见解,并引发新的问题,从而不断深入探讨。
Co-STORM 的运行原理
Co-STORM 的框架基于一个动态更新的思维导图,帮助用户跟踪和参与对话。在每轮对话中,AI 智能体根据对话历史和思维导图生成问题或答案。主持人则会利用未使用的信息和思维导图生成新问题,自动引导对话。最终,思维导图可用来生成完整的引用报告作为总结。
评估结果:Co-STORM 显著提升报告质量和对话参与度
研究者将 Co-STORM 与以下基线进行比较:
- RAG Chatbot: 该基线从搜索引擎检索信息并通过一问一答范式与用户交互。
- STORM + QA: 该基线使用 STORM 框架为给定主题生成报告以提供基本信息。
评估结果显示,Co-STORM 在报告质量和对话中问答轮次质量方面均优于基线。它通过模拟具有多个智能体角色的协作对话,类似于圆桌讨论,显著提升了报告的深度和新颖性。
Co-STORM 的意义
Co-STORM 的出现,标志着 AI辅助学术研究的又一重大突破。它不仅能够帮助用户快速生成高质量的学术文章,更能通过模拟圆桌讨论,激发更深层次的思考,帮助用户发现更多未知信息。
未来展望
Co-STORM 的未来发展方向包括:
- 提高AI 智能体的专业性和多样性: 涵盖更多领域和学科的专家,以及更细化的角色划分。
- 增强人机交互体验: 提供更直观的界面和更灵活的操作方式,让用户更方便地参与对话和引导讨论。
- 拓展应用场景:将 Co-STORM 应用于更多领域,例如新闻报道、法律分析、商业决策等。
Co-STORM 的出现,为学术研究带来了新的可能性。相信随着技术的不断发展,AI 辅助学术研究将变得更加强大,为人类探索知识的边界提供更多助力。
参考文献:
- Co-STORM: Collaborative Dialogue for Academic Research
- STORM: A Large Language Model-Powered Research Assistant
GitHub 地址:
体验地址:
Views: 0