周一. 4 月 14th, 2025

清华开源模型LongCite提升AI引用精准度减少幻觉

作者智能小编

9 月 29, 2024 #longcite, #每日AI快讯

上海枫泾古镇一角_20240824

上海枫泾古镇一角_20240824

0

引言：
在人工智能技术飞速发展的今天，大型语言模型（LLMs）在处理长文本问答任务时，如何确保回答的准确性和可验证性，成为了科研人员关注的焦点。清华大学最新推出的开源模型LongCite，以其独特的细粒度引用生成技术，为LLMs的精准引用和减少幻觉提供了新的解决方案。

主体：

一、LongCite项目概述

LongCite项目由清华大学推出，旨在提升LLMs在长文本问答任务中的可信度和可验证性。该项目通过生成细粒度的句子级引用，使用户能够验证模型的回答是否准确。项目核心包括以下组成部分：

LongBench-Cite评估基准：用于衡量模型在长文本问答中生成引用的能力。
CoF自动化数据构建流程：自动化生成带有细粒度引用的高质量长文本问答数据。
LongCite-45k数据集：为模型训练提供丰富的标注资源。
LongCite-8B和LongCite-9B模型：基于数据集训练，能理解长文本内容并提供准确的问答服务。

二、LongCite的主要功能

生成细粒度引用：LongCite使语言模型在回答长文本问题时，生成精确到句子级别的引用，用户能直接追溯到原文中的具体信息。
提高回答的忠实度：LongCite有助于确保模型的回答更加忠实于原文，减少模型出现的“幻觉”。
增强可验证性：用户基于模型提供的细粒度引用来验证回答的真实性和准确性。
自动化数据构建：LongCite采用了CoF流程，自动化地生成带有细粒度引用的高质量长文本问答数据。

三、LongCite的技术原理

长文本处理能力：LongCite支持超长上下文窗口的大型语言模型，能处理和理解长达数万字的文本。
细粒度引用生成：LongCite训练模型生成精确到句子级别的引用，提高回答的可验证性。
自动化数据构建流程（CoF）：使用自指导方法自动从长文本中生成问题和答案对，并进行监督式微调，提升模型表现。

四、LongCite的应用场景

LongCite的应用场景广泛，包括学术研究、法律咨询、金融分析、医疗咨询和新闻报道等。它为各领域专业人士提供了强大的信息检索和验证工具。

结论：

LongCite的推出，不仅为LLMs的精准引用和减少幻觉提供了新的技术路径，也进一步推动了人工智能技术在各个领域的应用。随着LongCite的不断发展和完善，我们有理由相信，未来LLMs在处理长文本问答任务时，将更加准确、可靠。

参考文献：
– LongCite项目地址：GitHub仓库，HuggingFace模型库，arXiv技术论文
– 相关文章：10个免费的AI论文写作工具和生成器，EmoTalk3D – 华为、复旦联合推出的3D数字人框架，MLE-Agent – 工程师的AI智能助手，自动创建基线模型等。

>>> Read more <<<

Views: 0

0

相关文章

Sports Brands Go Big Outsizing Luxury with Mega-Stores

4 月 14, 2025 智能小编

TikTok劲敌？两天MVP估值5亿，资本狂涌！

4 月 14, 2025 智能小编

运动品牌“巨无霸”店来袭，奢侈品都得让路？

4 月 14, 2025 智能小编

发表回复取消回复

图库

90年代申花出租车司机夜晚在车内看文汇报

黄山的油菜花

90年代的黄河路

shanghai

上海的陆家嘴

上海的陆家嘴

在上海浦东滨江公园观赏外滩建筑群-20240824

上海枫泾古镇一角_20240824

上海宝山炮台湿地公园的蓝天白云

为您推荐

Sports Brands Go Big Outsizing Luxury with Mega-Stores

2025年4月14日

TikTok劲敌？两天MVP估值5亿，资本狂涌！

2025年4月14日

运动品牌“巨无霸”店来袭，奢侈品都得让路？

2025年4月14日

Cloudflare Workers & Hyperdrive Supercharge Global MySQL App Performance

2025年4月14日