AI-NEWS · 2025年 8月 26日

阿里发布移动智能体

AliOpen Mobile-Agent 3:强大的GUI智能体家族

项目发布

2025年8月25日,X-PLUG团队在GitHub上正式发布了最新项目Mobile-Agent-v3。这是一个基于GUI-Owl的跨平台多智能体框架,具备强大的规划、进度管理、反思和记忆能力,旨在提升用户的GUI自动化体验。

核心技术特点

GUI-Owl基础模型

  • 多模态集成:集成了感知、基础功能、推理、规划和执行等功能
  • 端到端设计:原生端到端多模态智能体架构
  • 跨平台优势:使跨平台交互和多轮决策更加流畅
  • 推理能力:具备清晰的中间推理能力,确保多任务操作的稳定性能

功能增强

  • 异常处理优化:增强了异常处理和反思能力
  • 抗干扰能力:即使在面对弹窗和广告时也能保持高效运行
  • 关键信息记录:便于执行跨应用任务,极大方便用户日常操作

学术认可

多个前期版本(Mobile-Agent-v2和PC-Agent)已被NeurIPS2024和ICLR2025会议接收,体现了该项目在学术研究领域的广泛影响力。

资源支持

X-PLUG团队提供了丰富的资源支持:

  • 技术报告
  • 演示视频
  • 代码仓库

这些资源使开发者和研究人员能够更深入地探索Mobile-Agent的潜力,并参与后续的开发和优化工作。

项目地址Mobile-Agent-v3

火龙果频道