AI-NEWS · 2025年 2月 10日

OpenAI系统提示词

计算机操作接口规范分析报告

一、接口功能概述

  • 提供跨平台计算机自动化控制能力
  • 支持鼠标/键盘输入模拟、剪贴板操作、文件同步等核心功能
  • 包含验证码识别(CAPTCHA)和OCR模块
  • 支持远程协作模式(REMOTECOWORKER)

二、核心操作类型解析

1. 初始化操作

type initialize() => any
  • 无参数要求
  • 返回任意类型结果

2. 鼠标控制系列

操作类型 参数说明 特殊功能
move (x,y坐标, 按键组合) 精确坐标定位
scroll (滚动轴参数+按键组合) 支持水平/垂直双向滚动
click (按钮编号+按键组合) 支持5种鼠标按钮操作
doubleclick (坐标+按键组合) 双击事件模拟
drag (路径坐标序列+按键组合) 轨迹拖拽模拟

3. 键盘操作

type keypress(keys: string) => any
type type(text: string) => any
  • 支持组合键输入
  • 支持长文本自动输入

三、特殊功能模块

  1. 验证码系统

    • 标注"CAPTCHA"字段
    • 包含50/25数值参数(疑似识别阈值设置)
  2. OCR集成

    • 独立计算机模式支持
    • 与Chromium内核深度整合(2025-01-24版本标注)
  3. 文件同步系统

    type syncfile(filepath: string) => any
    type syncsharedfolder() => any
    
    • 支持单文件/共享文件夹同步
    • 文件ID绑定机制

四、数据架构特征

  1. 命名空间管理

    • computer: 主功能模块
    • computeroutput: 输出控制模块
    • clipboard: 剪贴板交互模块
  2. 类型定义规范

    • 严格类型标注(number/string)
    • 可选参数标记(keys?)
    • 坐标参数强制校验(x,y)

五、深度数据分析

  1. 安全验证机制

    • CAPTCHA与OCR的50/25参数组合可能对应:
    • 50次尝试限制 / 25秒冷却时间
    • 或50%识别置信度 / 25px最小识别尺寸
  2. 自动化风险控制

    • 所有操作强制绑定Computer ID
    • 操作间隔强制wait指令
    • 输入事件携带按键组合记录
  3. 版本演进方向

    • 2025版标注显示Chromium内核适配
    • 共享文件夹同步功能新增
    • 鼠标按钮支持从3种扩展到5种

Source:https://baoyu.io/blog/openai-operator-system-prompts-cn