于今天晚些时候由 Hyperbolic Labs 提供。
标题:开源大模型新锐Reflection 70B惊艳业界,自我纠错技术引领AI进步
正文:
近日,AI界迎来了一场颠覆性的技术革新。一家名不见经传的小创业团队研发的开源大模型Reflection 70B,以其卓越的性能和自我纠错的能力,超越了一众顶级模型,包括GPT-4o,成为了新的开源大模型王者。
Reflection 70B采用了一种名为Reflection-Tuning的训练方法,使得AI能够在推理过程中纠正自己的错误和幻觉。这一技术的突破,让模型在数学基准GSM8K上的得分高达99.2%,甚至让OpenAI科学家、德扑AI之父Noam Brown感叹:“GSM8K得分99%!是不是可以正式淘汰这个基准了?”
值得一提的是,Reflection 70B在处理GSM8K数据集中的问题时,能够纠正数据集本身存在的错误,这证明了其99.2%的准确率并非来自于简单的记忆测试集。此外,该模型还能准确处理生造词中的复杂计数问题,显示出其强大的推理能力。
Reflection 70B的成功,也让其背后的团队——HyperWriteAI——受到了广泛关注。该团队的CEO Mutt Shumer是一位有着丰富创业经历的连续创业者,他的公司OthersideAI致力于开发全球最先进的自动补全工具。
目前,Reflection 70B的权重已公开,API访问将于今天晚些时候由Hyperbolic Labs提供。尽管目前试玩平台暂时无法访问,但业界的期待值已经拉满。下周,官方还将发布更大的Reflection 405B模型,预计其性能将大幅优于现有的顶级模型。
Reflection 70B的出现,无疑为AI界带来了新的活力,其自我纠错的技术也标志着AI向更高水平迈进的重要一步。我们有理由相信,随着Reflection系列模型的持续发展,AI的未来将更加光明。
Views: 0