Claude 3.5 抢先OpenAI，大模型操控电脑！

10 月 24, 2024 #Claude, #机器之心

大模型操控电脑：Claude 3.5 重磅升级，抢先OpenAI

一夜之间，大模型像人一样操控电脑了！ Anthropic 公司在 10 月 23 日发布了升级版的 Claude 3.5 Sonnet，这款模型迎来了史诗级更新，它能够像人一样使用计算机。

Claude 3.5 Sonnet 的能力全面提升，其中代码能力尤为显著。同时，Anthropic 还发布了新的 Claude 3.5 Haiku 模型，其性能与之前最大模型 Claude 3 Opus 相当，但成本和速度与上一代 Haiku 相近。

最令人瞩目的是，Claude3.5 Sonnet 能够根据用户指令移动光标、点击相应位置以及通过虚拟键盘输入信息，模仿人类与计算机的交互方式。 Anthropic 表示，这是首个提供“计算机使用”能力公开 beta 测试的前沿 AI 模型。

这项功能的意义重大，它将解锁大量当前一代 AI 助手无法实现的应用。 想象一下，AI 可以像人类一样直接与计算机软件交互，这将为各种工作带来革命性的变化。

Claude 3.5 Sonnet 如何实现操控电脑？

Claude 3.5 Sonnet 的“计算机使用”能力建立在它对图像理解、推理和多模态能力的基础之上。它能够解读屏幕内容，并根据用户指令执行一系列逻辑步骤，从而实现对计算机的操作。

Anthropic 表示，他们仅使用少量简单软件（比如计算器和文本编辑器）对 Claude 进行训练，就让它具备了泛化这种能力，这让他们自己都感到惊讶。 他们解释说，出于安全原因，他们不允许模型在训练时访问互联网。

Claude 3.5 Sonnet 的“计算机使用”能力，将为 AI 带来无限可能。

开发者们已经开始尝试使用这项功能，并对它的潜力感到兴奋。 网友 Mckay Wrigley 表示，通过 API 使用这项新功能，设置时间不超过 10 分钟，而这项能力却能为 AI 开启无限可能，堪称 game changer。

Claude 3.5 Sonnet 的性能表现优于 OpenAI 的 ο1-mini 模型。 研究者 Austin Starks 的实验结果表明，Claude 3.5 Sonnet 在多个方面都表现出色，这让人们更加期待它的未来发展。

Claude 3.5 Sonnet 的“计算机使用”功能目前处于实验阶段，但它已经展现出巨大的潜力。 随着技术的不断发展，我们可以期待 AI 在更多领域发挥作用，并为人类生活带来更多便利和改变。

参考文献：

>>> Read more <<<