OpenAI首次推出人工智能代理Operator,以改变web任务自动化
2025-09-25 17:18

OpenAI首次推出人工智能代理Operator,以改变web任务自动化

  Shutterstock Germany o<em></em>nly - OpenAI - News Profitabilit?t September 2024

  OpenAI推出了一款新的人工智能代理“Operator”,旨在执行基于网络的任务,为企业提供潜在的生产力提升。

  该工具支持与屏幕上的元素进行交互,将其定位为在生成式人工智能领域竞争日益激烈的情况下自动化业务工作流程中的常规流程的解决方案。

  OpenAI在一篇博客文章中表示:“为Operator提供动力的是计算机使用代理(CUA),这是一种通过强化学习将gpt - 40的视觉能力与高级推理相结合的模型。”“CUA经过训练,可以像人类一样与图形用户界面(gui)——人们在屏幕上看到的按钮、菜单和文本字段——进行交互。这使它能够灵活地执行数字任务,而无需使用特定于操作系统或网络的api。”

  该公司补充说,CUA利用了多年来在多模态理解和推理方面的研究,将先进的GUI感知与结构化的问题解决相结合。

  它可以将任务分解为多步骤计划,并在遇到挑战时进行自我纠正,通过使模型能够使用人类通常依赖的工具并释放新的应用可能性,代表了人工智能开发的重要一步。

  用于处理日程安排和在线交易等任务的人工智能代理对企业的人工智能计划越来越感兴趣。关于OpenAI代理的传言已经流传了好几个月。

  本周,Perplexity推出了一款基于android的助手,提供预订、叫车和提醒等功能。

  去年,苹果通过整合苹果智能(Apple Intelligence)和与OpenAI合作增加ChatGPT支持,扩大了Siri的功能。

  去年,Anthropic还为其人工智能模型引入了一项名为“计算机使用”的功能,使克劳德·3.5·十四行诗(Claude 3.5 Sonnet)能够在计算机上自主执行任务。

  然而,分析人士认为,运营商可能比竞争对手有一些优势。

  Counterpoint Research的合伙人兼联合创始人尼尔?沙阿(Neil Shah)表示:“Operator比Perplexity和其他人工智能代理更先进,更具可定制性和可配置性。”“代理在需要时让用户‘接管’或与用户确认‘行动’、过滤敏感信息或保持‘监视’的能力是独一无二的,它在自主的同时给了用户更多的控制权。”

  另一个区别是,大多数当前的代理都被设计为根据用户提示和请求采取直接行动,而不是通过网站进行操作。

  Amalgam Insights首席执行官兼首席分析师Hyoun Park表示:“Open AI的Operator被设计成可以自主浏览网站并执行多步骤任务的网络代理。”“它的设计是为了帮助访问每个网站内的数据,以及执行目前需要重复点击和输入的复杂和耗时的任务。”

  人工智能代理为各行各业打开了大门,尤其是那些寻求提高效率和简化工作流程的行业。它们自动化数据收集和与基于web的平台交互等任务的能力为企业提供了重要价值。

  Cybermedia research行业研究小组副总裁普拉布?拉姆(Prabhu Ram)表示:“像Operator这样的人工智能代理,目前仍处于起步阶段,但从长远来看,它有可能通过自动化重复任务、个性化互动和提高工作流程效率,给客户服务、医疗保健、零售和物流等行业带来革命性的变化。”

  此外,该工具重新定义了“可访问性”的概念,使那些难以浏览或与网络互动的个人更容易访问在线资源。

  Park说:“这种代理在帮助员工快速收集信息或访问网站上所有可访问的数据和内容方面也很有用,这些数据和内容适合用户能够看到。”“网络代理可能会成为收集网站长尾信息的重要工具,这些信息可能隐藏在多步骤的工作流程中,这些工作流程对人类来说既耗时又难以协商或操纵。”

  Shah补充说,通过自定义API集成和可配置性等功能,Operator工具还可以使企业受益,使他们能够为内部目的部署这些代理,例如从自己的网站或内部网提取和组织数据。

  人工智能代理带来了一波新的安全挑战,潜在的风险包括滥用绕过系统保护措施。

  这些风险包括在公共部门网站上自动提交表单,发起流量攻击,破坏网站性能或逃避CAPTCHA保护,以及其他违规行为。

  OpenAI在其博客文章中表示,对模型、系统和部署后过程进行分层保护的安全方法是必不可少的。

  沙阿说:“OpenAI还需要确保在填写表格时如何保护敏感信息的隐私,这些信息是否留在设备上,以及用于强化的数据最终不会被滥用于广告或赞助列表,这是一种有利可图的商业模式。”

  该工具的功能也可能对b谷歌和其他搜索引擎构成挑战,这些搜索引擎依赖于收集用户数据和处理cookie来定位广告。通过赋予用户和OpenAI对数据的更多控制权,该技术可能会颠覆传统的广告模式。

本内容为作者翻译自英文材料或转自网络,不代表本站立场,未经允许不得转载
如对本稿件有异议或投诉,请联系本站
想要了解世界的人,都在 爱云网

相关推荐