Vercel发布Agent Browser:AI首次获得网页操控能力
核心摘要
2026年1月13日,前端开发平台Vercel正式发布了Agent Browser——一款专为AI智能体设计的浏览器自动化命令行工具。该工具首次赋予大型模型“不仅能理解网页,还能手动操作网页”的能力,标志着AI从“被动理解”迈向“主动执行”的关键一步。
产品亮点
1. 零配置,开箱即用
- 无需手动安装浏览器驱动或配置复杂依赖。
- 安装后即可直接使用,开发者仅需通过简单命令调用,即可让AI智能体与真实网页环境交互。
2. 双模式运行
- 可视化浏览器模式:用于实时调试,方便观察AI行为。
- 后台静默模式:用于执行批量任务,适用于自动化测试、数据采集或流程机器人等场景。
3. 轻量高效,为AI优化
- 深度优化数据结构:相比传统浏览器自动化工具(如Playwright),减少了高达93% 的不相关上下文,仅向AI提供关键DOM信息和可操作元素,显著提升推理效率与准确性。
- 底层采用Rust编写:相比基于Node.js或Python的传统方案,启动更快、资源占用更少、执行更稳定。
4. 广泛的兼容性
- 全面兼容主流AI编程助手:包括Claude Code、Gemini、Cursor、GitHub Copilot、Codex及opencode。
- 支持任何可运行Bash命令的操作系统。
行业意义
Agent Browser的发布意味着:
- AI将不再局限于分析与回答,而是能够像人类一样点击、填写表单、提交信息,甚至完成整个在线任务。
- 当AI能够独立完成预订、填表、比价乃至测试自身网站时,人机协作范式将发生根本性转变。
- Vercel正以此工具为杠杆,推动下一波AI原生应用的开发浪潮。
项目地址
本文来源:AIbase Daily,发布日期:2026年1月13日
