OpenAI 全新 ChatGPT 智能体可接管整台电脑并为你完成任务

有员工已用它自动化处理每周在旧金山 OpenAI 办公室的停车申请
OpenAI 正全力押注当前人工智能领域最受追捧的趋势——AI 智能体,这类工具比聊天机器人更进一步,能代表用户完成复杂的多步骤任务。该公司周四发布了 ChatGPT 智能体,将其定位为一款能够通过其”虚拟计算机”代你完成工作的工具。
在与 The Verge 的简报和演示中,ChatGPT 智能体的产品负责人 Yash Kumar 和研究负责人 Isa Fulford 表示,该产品由 OpenAI 专门为其开发的新模型驱动。公司表示,这款新工具能够执行诸如查看用户日历以简报即将到来的客户会议、规划并采购制作家庭早餐的食材、以及根据对竞争公司的分析创建幻灯片演示等任务。
ChatGPT Agent 背后的模型虽未正式命名,但通过强化学习(OpenAI 所有推理模型的通用技术)训练完成,可处理需要调用多种工具的复杂任务——例如文本浏览器、可视化浏览器及支持用户导入数据的终端。OpenAI 表示该工具融合了其现有两款 AI 产品 Operator 和 Deep Research 的核心能力。
为开发这款新工具,公司将原本负责 Operator 和 Deep Research 的团队合并为统一团队。Kumar 和 Fulford 向 The Verge 透露,新团队由 20 至 35 名成员组成,涵盖产品与研发部门。
演示环节中,Kumar 和 Fulford 展示了 ChatGPT Agent 的潜在应用场景:例如通过连接谷歌日历查看用户空闲时段来规划约会之夜,再交叉参考 OpenTable 寻找特定类型餐厅的空位。他们还演示了用户如何随时中断流程——比如追加另一类餐厅进行搜索。另一项演示则呈现了该工具如何生成关于 Labubus 与 Beanie Babies 市场趋势对比的研究报告。
富尔福德表示,她很喜欢用它进行网购,因为深度研究技术与 Operator 的结合使用效果更佳,比单独使用 Operator 更全面彻底。库马尔则称,他已开始使用 ChatGPT 代理来自动处理生活中的琐事,比如每周四自动申请 OpenAI 的新办公室停车位,而不是等到周一上班时才发现忘记申请导致无处停车。
库马尔指出,由于 ChatGPT 代理能访问”整台电脑”而不仅限于浏览器,他们”大幅扩展了工具集的功能范围”。
不过演示显示该工具运行速度可能较慢。当被问及延迟问题时,库马尔回应称其团队更注重”优化复杂任务处理”,用户本就不该坐着干等 ChatGPT 代理工作。
“即便花费 15 分钟甚至半小时,相比人工操作所需时间仍是巨大提速,”富尔福德补充道,并指出 OpenAI 搜索团队更专注于低延迟应用场景,”这类工具的特点就是你可以后台启动任务,稍后再回来查看结果。”
在 ChatGPT 代理执行任何”不可逆”操作(如发送邮件或预订服务)前,都会先征求用户许可,富尔福德表示。
由于该工具底层模型能力增强,OpenAI 表示已启动针对”高等级生物与化学能力”的安全防护措施。尽管公司声明目前没有”直接证据表明该模型能实质性帮助新手制造具有严重危害的生物或化学武器”。今年五月,Anthropic 公司在发布 Claude 模型 Opus 4 时也启用了类似防护机制 。
当被问及该工具是否获准进行金融交易时,库马尔回应称这些操作目前”受到限制”,并介绍了一项名为监视模式的附加保护功能——当用户访问金融类网站等特定网页时,若离开 ChatGPT 代理正在操作的标签页,工具将立即停止运行。
OpenAI 今日起将向 Pro、Plus 及 Team 用户逐步推送该工具——在工具菜单中选择”代理模式”或输入”/agent”即可使用——公司表示今年夏季晚些时候将向 ChatGPT Enterprise 和教育用户开放。目前尚未公布欧洲经济区及瑞士地区的推送时间表。
AI 代理的概念多年来一直是行业热议趋势。开发者们理想中的形态类似钢铁侠的 J.A.R.V.I.S.——这种工具能执行特定工作职能、查看人们日历以安排最佳会面时间、根据朋友喜好选购礼物等,但目前其功能主要局限于辅助编程和整理研究报告。
“AI 智能体”这一术语在 2023 年开始频繁出现在投资者和科技高管的视野中,并迅速获得关注。特别是在 2024 年 2 月,金融科技公司 Klarna 宣布其 AI 智能体上线仅一个月就处理了三分之二的客服对话——相当于 700 名全职人工客服的工作量。此后,亚马逊、Meta、谷歌等公司高管开始在一轮又一轮的财报电话会议中提及他们的 AI 智能体目标。为实现这些目标,AI 公司纷纷展开战略性招聘:例如谷歌上周就聘请了 Windsurf 公司的 CEO、联合创始人及部分研发团队成员,以推进其智能体 AI 项目。
OpenAI 推出的 ChatGPT 代理是继今年 1 月发布的 Operator 之后的又一重要产品。该公司曾将 Operator 描述为“一个能够访问互联网并为你完成任务的代理”,因为它经过训练能够处理互联网上的按钮、文本输入框等元素。这亦是人工智能领域更广泛趋势的一部分,各大企业正竞相开发能吸引消费者注意并最终成为用户习惯的人工智能代理。去年 10 月,亚马逊投资的人工智能初创公司 Anthropic(旗下拥有 Claude)发布了类似工具“Computer Use”,称其能像人类一样使用计算机,以完成用户指定的任务。包括 OpenAI、谷歌和 Perplexity 在内的多家 AI 公司也推出了名为“Deep Research”的 AI 工具,该工具可撰写用户指定主题的大型分析报告和研究报告。