正文:
近日,华为诺亚方舟实验室与我国科技大学(中科大)的研究人员共同推出了一项创新的工具调用模型——ToolACE。该模型在开源工具调用榜单BFCL上取得了与GPT-4相当的效果,并且已经开源,成为开源领域的第一名。
ToolACE模型的核心优势在于其能够自动化生成高准确性、高复杂性、高多样性的工具调用数据。大语言模型如GPT-4虽然在语言处理能力上表现出色,但独立运作时仍存在局限性,如无法进行复杂计算、获取实时信息以及提供专业定制化功能等。而ToolACE通过其工具调用能力,不仅限于文字处理,更能提供全面、实时、精确的服务,极大地扩展了其应用范围和实际价值。
为了提高模型的工具调用能力,高质量、多样化、且复杂的训练数据至关重要。然而,现实中工具调用数据的收集和标注极为困难,现有的合成数据生成方式在覆盖率和准确性方面仍存在不足。针对这一挑战,华为诺亚方舟实验室与中科大等机构的研究人员提出了ToolACE,一个统一的工具调用数据合成框架。
ToolACE通过创新的自进化合成过程,构建了一个包含26,507个多样化API的API库。通过多智能体之间的交互生成对话,并通过形式化的思维过程进行引导,确保生成的数据复杂且多样化。此外,ToolACE还结合了基于规则和基于模型的数据质检机制,确保数据准确性。
基于对应的合成数据对LLama 3.1进行微调,以8B的模型量级,在开源工具调用榜单BFCL上,ToolACE模型的表现与GPT-4相当,并超过了如Functionary等70B模型的效果。
这一成果标志着我国在人工智能领域的又一重要突破,为后续大语言模型的研究和应用提供了有力支持。未来,ToolACE有望在更多领域发挥重要作用,推动人工智能技术的进一步发展。
论文题目:ToolACE: Winning the Points of LLM Function Calling
论文链接:https://arxiv.org/abs/2409.00920
模型和数据链接:https://huggingface.co/Team-ACE/
本文由机器之心原创发布,如需转载,请标明出处。更多资讯,请关注机器之心公众号。
Views: 0