北京 – 在人工智能应用领域,一场变革正在悄然发生。当许多用户还习惯于传统搜索框的手动信息检索方式时,阿里巴巴旗下AI旗舰应用夸克,近日发布了“AI 超级框”功能,标志着超级Agent时代正式拉开帷幕。据称,这一升级将使至少2亿用户能够体验到具备L4级别自动驾驶能力的“AI电动汽车”,从而执行各类复杂的任务。
打开全新版本的夸克应用,界面设计与之前相比变化不大,依然保持了简洁的风格。熟悉的搜索框下方,新增了一个“深度思考”按钮,常用工具服务入口则分布在屏幕上下方。然而,这个看似普通的搜索框,其内在功能已经发生了质的飞跃。
“AI 超级框”:从信息检索到任务完成
为了测试“AI 超级框”的功能,笔者将一本电子书拖入框内,并要求其生成一份阅读总结。结果令人眼前一亮。夸克自动进入“AI 总结”模式,摘要、脑图、PPT等任务选项随即出现,用户可以根据需要进行选择。如果对自动生成的配图不满意,还可以通过AI生成图片进行替换;字体和内容也可以直接进行修改。最终,一份完整的PPT演示文稿便唾手可得,用户可以直接将其保存到网盘并分享给同事。整个过程都在“AI 超级框”内完成,无需跳转到其他应用。
此外,笔者还尝试向“AI 超级框”提问有关宋太祖死因的历史问题,以及金秀贤最近的八卦新闻。夸克不仅能够快速地从大量网页中整理出相关信息,还能根据上下文进行理解和推理,准确回答后续的“接着问”问题。
超级Agent的核心特征
与传统的AI Chatbot和垂直领域的智能助手不同,真正的超级Agent具备三个核心特征:意图理解、任务规划和自主执行。夸克的“AI 超级框”正是基于这些特征,通过强大的推理模型和多模态技术,将各种工具和服务转化为智能模块,从而满足用户在工作、学习和生活中的各种需求。
具体来说,当用户通过上传文档、截屏搜题、语音输入等方式,向“AI 超级框”提出需求时,超级Agent会首先理解用户的意图。然后,中枢Agent会对任务进行拆解、分配、思考和推理,决定任务的完成方式。例如,当用户输入“写个年终总结PPT”时,Agent可能会自动调用“AI 总结”功能;当用户询问“夜里咳嗽厉害睡不着,怎么办?”时,Agent可能会启动“AI 健康助手”。最后,Agent还会负责结果的输出和呈现,并支持用户在夸克上进行编辑、转换格式、保存和分享。
夸克:从生产力工具到AI超级应用
通过“AI 超级框”,夸克已经从一个单纯的生产力工具,转变为一个集成了推理、多模态大模型的AI超级应用。它可以被看作是一个由神经中枢负责调度和协同的Agent能力总成,能够自主地将用户需求转化为现实成果。
夸克之所以能够率先推出超级Agent功能,与其长期以来在AI搜索领域的积累密不可分。早在五年前,夸克就将自己定位为“年轻人的全能助手”,并围绕AI搜索,提供回答、创作、总结、解题、信息存储等一体化服务。如今,再搭配自研新模型的强大能力,夸克终于可以用一个极简的“AI 超级框”,去无限接近“全能助手”这一目标。
超级Agent的未来展望
夸克的“AI 超级框”的推出,预示着超级Agent时代的加速到来。随着大模型规划任务和使用工具的能力变得越来越强大,AI Agent的落地速度可能会比很多人想象的要快,尤其是在数字世界、在一个AI超级应用中。
参考文献
- 机器之心. (2024). 超级Agent,鸣枪起跑. https://www.jiqizhixin.com/articles/2024-03-16-3
Views: 0