OpenAI’s o1 智商120，陶哲轩赞平庸，AI实力揭秘！

9 月 17, 2024 #openaio1, #机器之心

OpenAI的o1模型自发布以来，在AI领域引起了广泛的关注和讨论。以下是关于o1模型的一些关键信息和分析：

智商测试结果：有报道指出，通过门萨智商测试，o1的智商高达120，这表明其认知能力相当高。然而，这种测试结果可能并不完全准确，因为智商测试通常针对的是人类，而不是AI。
陶哲轩的评价：著名数学家陶哲轩认为o1是一个“平庸但不无能的研究生”，这意味着o1在处理复杂数学问题方面有一定能力，但仍有待提高。
ARC Prize测试：在ARC Prize测试中，o1的表现并不出众，仅与Claude 3.5 Sonnet相当。这表明，尽管o1在某些方面有进步，但整体性能仍有待提高。
实际应用案例：有研究者在使用o1时取得了显著成果，例如一位天体物理学论文作者仅用6次Prompt，就让o1在1小时内创建了代码运行版本，这相当于他博士生期间10个月的工作量。
技术特点：o1是一个经过强化学习训练的语言模型，能够在响应用户之前产生一个很长的内部思维链。这表明o1在处理复杂推理任务方面具有一定的能力。
技术细节：OpenAI并未公布o1的底层技术细节，但研究者们通过逆向工程和在线讨论，试图了解o1的架构和工作原理。