于今天晚些时候由 Hyperbolic Labs 提供。


标题:开源大模型新锐Reflection 70B惊艳业界,自我纠错技术引领AI进步

正文:

近日,AI界迎来了一场颠覆性的技术革新。一家名不见经传的小创业团队研发的开源大模型Reflection 70B,以其卓越的性能和自我纠错的能力,超越了一众顶级模型,包括GPT-4o,成为了新的开源大模型王者。

Reflection 70B采用了一种名为Reflection-Tuning的训练方法,使得AI能够在推理过程中纠正自己的错误和幻觉。这一技术的突破,让模型在数学基准GSM8K上的得分高达99.2%,甚至让OpenAI科学家、德扑AI之父Noam Brown感叹:“GSM8K得分99%!是不是可以正式淘汰这个基准了?”

值得一提的是,Reflection 70B在处理GSM8K数据集中的问题时,能够纠正数据集本身存在的错误,这证明了其99.2%的准确率并非来自于简单的记忆测试集。此外,该模型还能准确处理生造词中的复杂计数问题,显示出其强大的推理能力。

Reflection 70B的成功,也让其背后的团队——HyperWriteAI——受到了广泛关注。该团队的CEO Mutt Shumer是一位有着丰富创业经历的连续创业者,他的公司OthersideAI致力于开发全球最先进的自动补全工具。

目前,Reflection 70B的权重已公开,API访问将于今天晚些时候由Hyperbolic Labs提供。尽管目前试玩平台暂时无法访问,但业界的期待值已经拉满。下周,官方还将发布更大的Reflection 405B模型,预计其性能将大幅优于现有的顶级模型。

Reflection 70B的出现,无疑为AI界带来了新的活力,其自我纠错的技术也标志着AI向更高水平迈进的重要一步。我们有理由相信,随着Reflection系列模型的持续发展,AI的未来将更加光明。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注