OpenAI 在 5 月 7 日上线了 Chrome 插件 Codex,说实话,这玩意儿给我的第一感觉是:AI 终于不再只是对着屏幕聊天的“对话框”,而是直接伸手进你浏览器里干活的“数字员工”了。
这东西到底能干啥?
简单来说,只要授权,Codex 就能直接接管 Chrome。它不仅能看网页,还能点按钮、填表单,甚至帮你登录那些需要多步操作的网站。以前你得自己一步步点,现在相当于请了个虚拟实习生在旁边替你操作。
但是,用了几次后,我发现它的表现有点“反直觉”:
- 越简单的活,越容易翻车
我试了试整理标签页这种基础操作,结果 Codex 经常看走眼,或者点错地方。这种“笨手笨脚”反而让我有点意外,毕竟理论上 AI 应该处理简单指令最稳嘛。 - 越复杂的活,反而越顺手
一旦任务难度上来,这货才真正显出本事。- 抓信息很准:让我去把苹果、华为、小米这几家手机的具体参数扒干净,它整合得挺利索,没掉链子。
- 能连招:让我构思个创意主题,它自己写不出东西,但能熟练地调用 Deepseek 来写内容,最后还能把生成的 AI 新闻日报自动整理成表格。
这种多步骤、高逻辑的操作,它处理起来明显比简单任务更在行。
到底能不能放心用?
目前看来,它还是个“半自动助手”,离完全放手还早。
- 能用但得盯着:识别网页上的按钮、输入框位置,它偶尔还会发懵,不太精准。
- 怎么用比较香:处理一些不涉及隐私的杂活,比如查资料、做基础表格,它能帮你省下不少力气,实现高度自动化。
- 千万别乱用:要是涉及核心隐私或者高安全要求的任务,还得你自己全程盯着,人工验证是必须的。
总的来说,现在把它当成一个“有能力的半自动助手”比较合适,指望它完全独立做决策,还是有点悬。
