阿里巴巴发布Qwen2-Math：开创数学AI新纪元，开源助力全球科研

作者智能小编

8 月 28, 2024 #Qwen2, #每日AI快讯, #阿里

上海的陆家嘴

阿里巴巴近日宣布，其通义千问团队成功研发出数学专用的开源AI模型——Qwen2-Math。这款模型旨在为解决高级数学问题提供强大的工具，特别是在多步逻辑推理和竞赛题解答方面展现出卓越性能。

Qwen2-Math的主要特点

Qwen2-Math经过数学专用语料库的预训练和指令微调，能够出色应对多种数学基准测试。模型具备以下关键功能：

多步逻辑推理：能解决需要复杂多步逻辑推理的高级数学问题。
竞赛题解答：能够处理数学竞赛级别的难题，如国际数学奥林匹克（IMO）题目。
超越性能力：在数学能力上超越了其他开源模型，甚至一些闭源模型。
双语及多语言支持：目前支持英语，正在开发中英双语及更多语言版本，以扩大应用范围。

技术原理与优化方法

Qwen2-Math的构建基于大规模预训练，使用大量数学相关资料进行训练，包括文本、书籍、代码和考试题目。模型通过专用语料库进一步聚焦数学领域，通过指令微调提升对数学解题指令的理解。此外，采用奖励模型和二元信号强化正确解题行为，并利用拒绝采样构建高质量的训练数据集。PPO强化学习算法优化模型性能，确保在特定任务上的高效表现。数据去污染策略则确保了模型评估的公正性。