大模型操控电脑:Claude 3.5 重磅升级,抢先OpenAI
一夜之间,大模型像人一样操控电脑了! Anthropic 公司在 10 月 23 日发布了升级版的 Claude 3.5 Sonnet,这款模型迎来了史诗级更新,它能够像人一样使用计算机。
Claude 3.5 Sonnet 的能力全面提升,其中代码能力尤为显著。同时,Anthropic 还发布了新的 Claude 3.5 Haiku 模型,其性能与之前最大模型 Claude 3 Opus 相当,但成本和速度与上一代 Haiku 相近。
最令人瞩目的是,Claude3.5 Sonnet 能够根据用户指令移动光标、点击相应位置以及通过虚拟键盘输入信息,模仿人类与计算机的交互方式。 Anthropic 表示,这是首个提供“计算机使用”能力公开 beta 测试的前沿 AI 模型。
这项功能的意义重大,它将解锁大量当前一代 AI 助手无法实现的应用。 想象一下,AI 可以像人类一样直接与计算机软件交互,这将为各种工作带来革命性的变化。
Claude 3.5 Sonnet 如何实现操控电脑?
Claude 3.5 Sonnet 的“计算机使用”能力建立在它对图像理解、推理和多模态能力的基础之上。它能够解读屏幕内容,并根据用户指令执行一系列逻辑步骤,从而实现对计算机的操作。
Anthropic 表示,他们仅使用少量简单软件(比如计算器和文本编辑器)对 Claude 进行训练,就让它具备了泛化这种能力,这让他们自己都感到惊讶。 他们解释说,出于安全原因,他们不允许模型在训练时访问互联网。
Claude 3.5 Sonnet 的“计算机使用”能力,将为 AI 带来无限可能。
开发者们已经开始尝试使用这项功能,并对它的潜力感到兴奋。 网友 Mckay Wrigley 表示,通过 API 使用这项新功能,设置时间不超过 10 分钟,而这项能力却能为 AI 开启无限可能,堪称 game changer。
Claude 3.5 Sonnet 的性能表现优于 OpenAI 的 ο1-mini 模型。 研究者 Austin Starks 的实验结果表明,Claude 3.5 Sonnet 在多个方面都表现出色,这让人们更加期待它的未来发展。
Claude 3.5 Sonnet 的“计算机使用”功能目前处于实验阶段,但它已经展现出巨大的潜力。 随着技术的不断发展,我们可以期待 AI 在更多领域发挥作用,并为人类生活带来更多便利和改变。
参考文献:
Views: 0