AI-NEWS · 2024年 10月 26日

Zhipu AI Launches AutoGLM Agent: Simulate Human Phone Operations with Simple Commands

新闻总结

概述

Zhipu Technology团队近期推出了一款基于GLM技术团队研究成果的新产品——AutoGLM。这是一个能够模拟人类在手机上操作的智能代理,可以执行各种任务。

主要特点和应用

  • 应用场景广泛:AutoGLM不仅可以完成点赞、评论朋友圈(WeChat Moments)、淘宝购物历史订单、携程订酒店、12306购票以及美团点外卖等任务,理论上还可以实现任何人类在视觉电子设备上的操作。
  • 使用便捷:用户可以通过安装“Zhipu Qingyan”插件来体验AutoGLM-Web,该插件能够模拟用户的网页浏览和点击行为,并自动完成高级搜索、总结和内容生成。此外,AutoGLM已在Android系统上开放了Beta测试申请,并与荣耀等手机制造商展开了深度合作。

技术背景

  • 核心技术:AutoGLM基于Zhipu自主研发的“基础代理解耦中间接口”和“自我进化在线课程强化学习框架”,解决了大规模模型代理任务规划和动作执行中的能力冲突、训练任务和数据稀缺、反馈信号稀疏及策略分布漂移等问题。
  • 技术优势
    • 解决了“动作执行”不精确、“任务规划”灵活性不足的问题,通过设计自然语言中间接口实现了“任务规划”与“动作执行”的解耦,大幅提升了代理能力。
    • 引入了自我进化在线课程强化学习框架,在真实环境中不断学习和提升大规模模型代理的能力。

技术性能

  • 性能表现:在Phone Use和Web Browser Use领域,AutoGLM的性能显著优于GPT-4o和Claude-3.5-Sonnet。
    • 在AndroidLab评估基准测试中,AutoGLM的表现超越了GPT-4o和Claude-3.5-Sonnet。
    • 在WebArena-Lite评估基准中,AutoGLM的性能提升了约200%,显著缩小了人类与大规模模型代理在GUI操作成功率上的差距。

展望

AutoGLM的推出标志着人工智能技术在“手机使用”领域的重大进步,使得AI应用更加贴近人们的日常生活。未来,随着更多深度合作和技术优化,AutoGLM有望进一步提升用户体验和智能化水平。


这份总结涵盖了AutoGLM的核心特点、应用场景、技术优势以及性能表现等方面的信息,为公司决策提供了详实的数据支持与深入分析。

Source:https://www.aibase.com/news/12754