“Reflection 70B Emerges as New King of Open-Source AI Models Overtaking GPT-4

作者智能小编

9 月 6, 2024 #机器之心

90年代申花出租车司机夜晚在车内看文汇报

正文：
近日，在开源AI大模型领域，一场激烈的竞赛再次掀起高潮。新晋王者的诞生，标志着该领域技术水平的又一次飞跃。这款名为Reflection 70B的开源大模型，不仅在各项基准测试中超越了GPT-4o，还击败了Llama 3.1等知名模型，成为新的焦点。

Reflection 70B由AI写作初创公司HyperWrite推出，其CEO Matt Shumer表示，Reflection-70B是目前世界上最顶级的开源AI模型。该模型基于Meta的Llama 3.1 70B Instruct，采用原始的Llama chat格式，确保了与现有工具和pipeline的兼容性。

在多个基准测试中，Reflection 70B的表现始终优于Meta的Llama系列，并与GPT-4o等全球顶尖的商用模型展开了激烈竞争。特别是在GSM8K测试中，其得分高达99.2%，几乎接近满分。此外，Reflection 70B的零样本推理能力也相当出色，在五次样本测试中超越了Claude 3.5、Gemini 1.5以及Llama 405等模型。

值得关注的是，Reflection 70B具备“错误识别”和“错误纠正”的能力。通过名为“Reflection-Tuning”的技术，模型能在最终确定回复之前，先检测自身推理的错误并进行纠正。这一特性使得Reflection 70B特别适用于需要高精度的任务。

HyperWrite公司计划将Reflection 70B模型集成到其主要的AI写作助手产品中，并预计Reflection 405B将在下周上市，其性能有望超越目前的专有或闭源LLM，如OpenAI的GPT-4o。

值得一提的是，Reflection 70B的发布仅用了三周时间，由HyperWrite公司CEO Matt Shumer和另一位创始人Sahil Chaudhary共同完成。他们表示，得益于Sahil的公司Glaive提供的合成数据服务，训练数据得以快速生成。

尽管Reflection 70B在发布后迅速走红，但由于试用人数过多，导致模型反应较慢。然而，根据网友的测评，Reflection 70B在多个测试中表现出色，成为开源模型中的佼佼者。

尽管Reflection 70B的底层模型采用了Meta的Llama 3.1 70B Instruct，引发了一些争议，但其在技术上的突破和创新仍然值得肯定。随着AI技术的不断发展，未来开源AI大模型领域将会有更多精彩的表现。

>>> Read more <<<