小团队逆袭！Reflection 70B开源大模型刷新数学记录，AI王座易主

作者智能小编

9 月 7, 2024 #IT资讯, #新闻

于今天晚些时候由 Hyperbolic Labs 提供。

标题：开源大模型新锐Reflection 70B惊艳业界，自我纠错技术引领AI进步

正文：

近日，AI界迎来了一场颠覆性的技术革新。一家名不见经传的小创业团队研发的开源大模型Reflection 70B，以其卓越的性能和自我纠错的能力，超越了一众顶级模型，包括GPT-4o，成为了新的开源大模型王者。

Reflection 70B采用了一种名为Reflection-Tuning的训练方法，使得AI能够在推理过程中纠正自己的错误和幻觉。这一技术的突破，让模型在数学基准GSM8K上的得分高达99.2%，甚至让OpenAI科学家、德扑AI之父Noam Brown感叹：“GSM8K得分99%！是不是可以正式淘汰这个基准了？”

值得一提的是，Reflection 70B在处理GSM8K数据集中的问题时，能够纠正数据集本身存在的错误，这证明了其99.2%的准确率并非来自于简单的记忆测试集。此外，该模型还能准确处理生造词中的复杂计数问题，显示出其强大的推理能力。

Reflection 70B的成功，也让其背后的团队——HyperWriteAI——受到了广泛关注。该团队的CEO Mutt Shumer是一位有着丰富创业经历的连续创业者，他的公司OthersideAI致力于开发全球最先进的自动补全工具。

目前，Reflection 70B的权重已公开，API访问将于今天晚些时候由Hyperbolic Labs提供。尽管目前试玩平台暂时无法访问，但业界的期待值已经拉满。下周，官方还将发布更大的Reflection 405B模型，预计其性能将大幅优于现有的顶级模型。

Reflection 70B的出现，无疑为AI界带来了新的活力，其自我纠错的技术也标志着AI向更高水平迈进的重要一步。我们有理由相信，随着Reflection系列模型的持续发展，AI的未来将更加光明。

>>> Read more <<<