OpenAIo1 被破解？开源模型崛起！

9 月 17, 2024 #OpenAI, #复现, #机器之心

正文：
近日，人工智能领域再掀热潮，OpenAI发布的ο1系列模型因其强大的推理性能而备受瞩目。然而，仅过去短短三四天，就有研究者宣称成功复现或开发出了与ο1性能相仿的推理技术，并且不止一个。

北京时间9月13日午夜，OpenAI的ο1系列模型一经推出，便引起了研究者的极大兴趣。他们纷纷尝试挖掘模型背后的技术奥秘，并寻求复现其卓越性能。尽管OpenAI采取了一些措施以抑制技术窥探，比如对试图诱导ο1模型公布思维过程的用户进行封号，但研究者的热情并未因此减退。

其中，Martin Bowling提出的Llamaberry项目引起了广泛关注。Llamaberry的核心思路是使用思维链（CoT）实现推理，其灵感来源于代表ο1模型的草莓（Strawberry）。通过多轮推理，Llamaberry能够引导AI进行更深入的思考，从而得出更合理、连贯的答案。

具体而言，Llamaberry是基于Groq上的Llama 3.1 70B模型实现的，通过多轮推理，AI在给出答案前会进行多步思考。这一过程类似于大厨烹饪美食，从备菜到摆盘，而非简单地将预制菜微波加热。

Martin Bowling在博客中将思维链推理比作给AI一个笔记本，展示其工作过程。这不仅包括答案，还有详细的思维过程。这种方法使得AI能够像人类专家一样，深入思考问题，攻克难题。

值得注意的是，Llamaberry的实现过程中，设置基本规则、引导AI进行思考以及综合结果等环节均至关重要。这些环节共同构成了AI的多轮推理机制，使其能够逐步完善思维，最终得出合理的答案。

此次开源模型的成功复现，不仅展现了其在推理性能上的竞争力，也为人工智能领域的研究提供了新的思路。未来，随着技术的不断发展，我们有理由相信，人工智能将更好地服务于人类。