Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

最新消息最新消息
0

上海,2025年3月21日 – 人工智能领域迎来重大突破。3月20日,中国人工智能领军企业实在智能在第八次新品发布会上正式推出行业通用智能体——实在 Agent,标志着AI技术从实验室研发阶段迈向产业实际应用的关键一步。

这场以“自主感知环境、规划路径、操作万物”为主题的发布会,通过真实场景演示,首次验证了数字员工全流程接管复杂办公任务的可行性。从多模态指令解析、跨系统数据调用到端到端任务闭环,实在 Agent展现了全程无需人工干预的强大能力,预示着人机协作模式的深刻变革。

通用智能体:重构人机协作的破局之战

自2025年3月初Manus引发市场关注以来,通用Agent的概念迅速升温,但也引发了关于技术成熟度和应用前景的讨论。支持者认为,通用Agent将成为“智能体经济”的基石,重塑生产协作范式;而质疑者则认为,工程化实践尚未成熟,现阶段仍属于“有限场景解决方案”。

目前,学界对通用Agent的定义是“具备跨模态环境感知、动态目标拆解与多工具协同执行能力的智能系统”。与依赖预设规则的专用Agent不同,通用Agent通过自主感知、决策和执行,能够动态适应环境变化并解决多样化问题。

然而,现有智能体产品在技术实现层面仍面临挑战。市面上主流的端到端集成方案或大模型外挂API接口的混合架构,在处理复杂任务时效率瓶颈明显。多模态模型协同需要经历数据格式转换、接口协议适配、跨平台调用等中间环节,导致任务响应时间普遍较长。此外,在传统封闭的C/S架构(如OA系统)下,跨系统操作链路存在天然断点,容易出现服务调用超时、数据解析错误等异常情况,难以实现跨平台系统的无缝协同。

技术底座揭秘:三大创新架构构建护城河

实在智能发布的实在 Agent,似乎旨在打破这些瓶颈。发布会上,实在智能合伙人兼核心算法部负责人欧阳小刚详细阐述了实在 Agent 的三大核心技术体系:

  • 类人级推理能力: 依托自研 TARS 大模型,实在 Agent 在步骤拆解准确率上超越 GPT-4 和 DeepSeek,中文理解能力达到 SOTA 水平,并实现全栈国产化适配,支持英伟达、昇腾及国产自主架构的训练与部署。
  • 无限链接能力: 通过自研流程自动化引擎和多模态模型 TARS-VL,实在 Agent 支持操作网页、软件、接口、文档等任意数字化工具。在 GUI 元素理解测试中,TARS-VL 准确率较 GPT-4o 高出 4%,领先开源模型 10%,并在 mind2web 和 screenspot 等数据集上保持绝对优势。
  • 场景适应能力: 运用自动仿真技术,实在 Agent 将特定软件的构建周期缩短至 3-5 天,同时推出多参数模型(67B 高配版与 7B 轻量版)适配端侧与云侧部署,并提供软硬件一体化解决方案,涵盖华为昇腾、惠普 Z 系列等一体机产品。

实在智能创始人兼CEO孙林君表示:“实在智能通过三大核心技术突破,可为企业智能化转型提供可落地、可进化、可扩展的全栈式解决方案。”

在技术攻坚与创新层面,实在智能还引入“可变形矩形卷积和卷积核分配”等创新性技术理念,并以此为基础成功训练出多个辅助检测模型。在针对各类屏幕GUI元素理解和定位能力的测试集中,TARS-VL表现不俗。例如,在两个开源的benchmark数据集——mind2web和screenspot上进行测试:

  • 在 mind2web 数据集上,TARS-VL 在 Task、Domain 和 Web 三个场景上的元素匹配准确率,比 GPT-4o、Ominiparser、Claude 等模型高出 10%;
  • 在 screenspot 数据集上,TARS-VL 的元素匹配准确率也保持遥遥领先。

这些数据表明,实在 Agent 在理解和操作复杂图形用户界面方面具有显著优势。

产品化突破:企业级智能体的落地范式

顶尖的技术,只有搭载于出色的产品之上,才能充分释放其价值。实在智能对实在Agent智能体的创新特质与产品优势进行了详细解读:

  • 低门槛交互: 零配置启动客户端,通过快捷键一键唤起,支持语音、文本、文件拖拽三种交互方式,模糊指令可自动拆解为任务步骤;
  • 透明化执行: 实时显示操作日志与进度条,支持动态干预与并行任务处理,保障用户对任务的全程掌控;
  • 开放创作平台: 通过 “智能体画布” 和预训练技能库,用户可快速开发专属 AI 智能体,存量 RPA 流程可一键迁移升级,实现 RPA 与 AI 的深度融合。

实在Agent智能体,不仅是个人助理,更是企业级智能体解决方案——企业大脑。企业只需将文档、数据、系统沉淀到实在智能体平台,即可实现资产数据化。如此一来,企业内部的每一位成员,都能借助实在Agent,便捷调用企业知识库以及已构建完成的业务自动化流程,从而形成企业独有的 “中央处理器”。

在实在智能发布会的演示环节中可以看到,实在 Agent 不仅接入了自家的 TARS 大模型,还整合了 DeepSeek、智谱 AI、GPT、千问等一众主流大模型。企业能够依据不同模型在各自擅长的领域进行选择,实现最佳性能。

展望未来:AI自主执行时代的到来

实在 Agent 的发布,无疑为通用智能体的产业落地注入了新的活力。它不仅展示了AI技术在人机协作方面的巨大潜力,也为企业智能化转型提供了新的思路和工具。

随着技术的不断发展和应用场景的不断拓展,我们有理由相信,AI自主执行时代正在加速到来。未来,AI将不再仅仅是辅助工具,而是能够真正理解人类意图、自主完成复杂任务的智能伙伴,从而极大地提高生产效率,释放人类的创造力。

参考文献:

(完)


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注