
新德里,1月24日:OpenAI推出了Operator,这是一种新的人工智能代理,可以在线自动执行任务。这款新的人工智能工具可以浏览网页,为用户执行各种任务,比如填写表格、订购杂货,甚至创建表情包。Operator目前是美国专业用户的研究预览版,据说它可以简化重复的浏览器任务,通过增强用户体验来节省时间。
OpenAI Operator目前处于研究预览阶段,有一定的局限性。ChatGPT制造商计划根据用户反馈对其进行改进。它有自己的浏览器,可以通过输入、点击和滚动来浏览网页并与之互动。Operator是OpenAI首批独立执行任务的代理之一。用户可以提供一个任务,它将执行该任务。
Operator现在可供ChatGPT Pro在美国的用户使用。该研究预览版将帮助Sam altman运营的OpenAI收集用户的见解,以进一步改进。此外,还计划向Plus、Team和Enterprise用户扩展访问权限,并打算在未来将这些功能集成到ChatGPT中。
操作系统由新型计算机使用代理(CUA)模型提供支持,该模型将gpt - 40的视觉功能与高级推理功能集成在一起。开发CUA是为了与图形用户界面(gui)进行交互,例如屏幕上的按钮、菜单和文本字段。操作员可以使用鼠标和键盘操作查看并与浏览器交互。它可以在没有自定义API集成的情况下在web上运行。它可以使用它的推理能力进行自我纠正。当它遇到问题时,它可以在必要时将控制权交还给用户。
用户可以通过添加所有或某些网站的说明来定制他们的工作流程。操作员可以根据用户描述处理任务,用户可以随时选择控制。操作员提示用户接管登录或支付细节的操作,或者在解决验证码时。它还允许保存提示以便快速访问,并且可以通过在多个选项卡中启动新对话来一次运行多个任务。




