Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

shanghaishanghai
0

北京讯 – 在人工智能领域,提升模型的推理能力一直是研究人员孜孜以求的目标。近日,阿里巴巴集团与中国科学技术大学联合推出了一款新型工具增强型推理模型——START (Self-Taught Reasoner with Tools),该模型通过结合外部工具,显著提升了大型语言模型(LLMs)在复杂问题解决中的能力。

START模型的核心在于其“Hint-infer”技术和“Hint-RFT”框架。“Hint-infer”技术允许在推理过程中插入提示,引导模型主动使用外部工具,例如Python代码执行器,进行复杂的数学计算、逻辑验证和模拟。而“Hint-RFT”框架则基于拒绝采样微调,对模型生成的推理轨迹进行评分、过滤和修改,从而优化模型的工具使用能力。

技术突破:长链推理与工具集成的完美结合

START模型的独特之处在于它将长链推理(Long CoT)与工具调用相结合。长链推理能够将复杂问题分解为多个中间步骤,模拟人类的深度思考过程,但传统长链推理在面对需要精确计算或验证的问题时往往力不从心。START通过集成外部工具,弥补了这一不足。模型在推理过程中可以生成代码,并利用工具执行验证结果,从而提高答案的准确性。

“我们希望通过START模型,赋予AI更强的‘思考力’,使其不仅能够理解问题,还能像人类一样利用工具来解决问题。”阿里巴巴相关研究人员表示。

性能卓越:多项基准测试超越现有模型

据了解,START模型在多个基准测试中表现出色,超越了现有的模型。尤其是在复杂数学问题、科学问答和编程挑战等领域,START的准确性和效率都得到了显著提升。值得一提的是,START也是首个开源的长链推理与工具集成相结合的模型,这无疑将加速相关领域的研究和应用。

应用前景:助力科研、教育与产业升级

START模型的应用场景十分广泛,包括:

  • 数学问题求解: 能够解决复杂的数学题目,如数学竞赛和高等数学问题,并通过代码验证提高准确性。
  • 科学研究辅助: 帮助处理物理、化学和生物等领域的复杂计算和科学问题。
  • 编程与调试: 生成代码并自动调试,解决编程难题,提升开发效率。
  • 跨学科问题解决: 综合运用多学科知识,解决工程设计、数据分析等复杂任务。
  • 教育与学习: 作为智能辅导工具,辅助学生学习数学和科学,提供详细的解题过程和反馈。

专家指出,START模型的推出,不仅是人工智能技术的一次重要突破,也将为科研、教育和产业升级带来新的机遇。随着AI技术的不断发展,我们有理由相信,未来的AI将更加智能、高效,能够更好地服务于人类社会。

项目地址:

关键词: 阿里巴巴,中国科学技术大学,人工智能,推理模型,START,长链推理,工具集成,开源,AI工具。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注