考研数学126分大神出手！智谱推理模型免费用

引言：

在2024年的最后一天，人工智能领域再次迎来重大突破。智谱AI，这家国内领先的人工智能公司，正式发布了其首个专注于深度推理的模型——GLM-Zero-Preview。这款模型不仅在考研数学模拟测试中取得了126分的优异成绩，还展现了强大的代码编写能力，能够独立开发小游戏。更令人兴奋的是，这款强大的推理模型目前已向公众免费开放，标志着人工智能技术正加速走向普及化。

主体：

智谱补齐AI版图，推理模型崭露头角

从年初到年末，智谱AI接连推出了新一代基座大模型、多模态模型、视频生成模型以及语音模型，不断拓展其在人工智能领域的布局。而此次发布的GLM-Zero-Preview，则补上了其在推理模型领域的关键一环。据智谱AI介绍，GLM-Zero-Preview是GLM家族中专注于增强AI推理能力的模型，它擅长处理数理逻辑、代码和需要深度推理的复杂问题。与基座模型相比，GLM-Zero-Preview在保持通用任务能力的同时，大幅提升了专家任务能力，这无疑为人工智能的应用开辟了新的可能性。

数学能力惊艳，堪比优秀研究生

为了验证GLM-Zero-Preview的推理能力，智谱AI让其挑战了一整套2025年考研数学一的试题。结果令人瞩目，该模型最终取得了126分的成绩，达到了优秀研究生的水平。更令人印象深刻的是，模型不仅给出了答案，还详细展示了解题步骤，这表明其具备了深入理解和解决复杂数学问题的能力。

代码能力卓越，可独立编写小游戏

除了强大的数学能力，GLM-Zero-Preview在代码编写方面也展现了非凡的实力。该模型熟练掌握多种编程语言，能够帮助开发者快速编写代码。例如，它可以独立使用HTML语言编写第一人称射击游戏，这充分展示了其在代码生成和逻辑构建方面的能力。此外，GLM-Zero-Preview还具备代码调试能力，能够快速识别错误并给出修复建议，这将大大提高开发效率。

免费开放，人人可体验AI推理能力

目前，GLM-Zero-Preview已经上线使用，用户可以在智谱清言网页端选择“Zero推理模型”智能体，上传文字或图片即可免费体验。此外，GLM-Zero-Preview的API也在智谱开放平台同步上线，方便开发者调用。这一举措无疑将大大降低人工智能技术的门槛，让更多人能够体验到AI推理的强大能力。

深度推理能力实测，表现亮眼

为了进一步验证GLM-Zero-Preview的性能，机器之心进行了全方位的测试。测试结果显示，该模型在处理各种类型的推理问题时都表现出色。

逻辑推理： 在处理中文逻辑陷阱题时，GLM-Zero-Preview能够从不同角度进行深度推理，排除干扰项，得出正确结论。面对复杂的中文逻辑推理问题，它能够清晰地罗列情况，进行假设分析，并通过缜密的条件验证，给出逻辑清晰的解题步骤。
常识推理： GLM-Zero-Preview具备丰富的常识，能够准确理解时间顺序和事件发生的时序关系，在时间推理场景中表现出色。
数学能力： GLM-Zero-Preview展现了强大的归纳和演绎能力，能够解决复杂的数学问题，并给出详细的解题思路。
弱智吧问题： 面对一些看似无厘头的问题，GLM-Zero-Preview能够进行理论和实际可行性的分析，并展开论证，展现了其严谨的逻辑思维。

技术突破：强化学习与推理能力提升

据智谱AI介绍，GLM-Zero-Preview是其首个基于扩展强化学习技术训练的推理模型。通过增加强化学习的训练量，该模型的深度推理能力得到了稳步提升。同时，随着模型在推理阶段可以思考的token数变多以及计算量增加，GLM-Zero-Preview的输出结果质量也稳步提升。这些技术突破使得GLM-Zero-Preview具备了类人的思考决策过程，初步具备了“推理过程中自主决策、问题拆解、尝试多种方式解决问题”等能力。

结论：

智谱AI发布的GLM-Zero-Preview不仅是其在推理模型领域的重大突破，也标志着人工智能技术正加速走向普及化。这款模型在数学、代码和逻辑推理方面的卓越表现，以及其免费开放的政策，都将对人工智能的发展产生深远的影响。我们有理由相信，随着技术的不断进步，人工智能将在未来发挥更加重要的作用，为人类带来更多便利和福祉。

参考文献：