新闻总结
概述
Zhipu Technology团队近期推出了一款基于GLM技术团队研究成果的新产品——AutoGLM。这是一个能够模拟人类在手机上操作的智能代理,可以执行各种任务。
主要特点和应用
- 应用场景广泛:AutoGLM不仅可以完成点赞、评论朋友圈(WeChat Moments)、淘宝购物历史订单、携程订酒店、12306购票以及美团点外卖等任务,理论上还可以实现任何人类在视觉电子设备上的操作。
- 使用便捷:用户可以通过安装“Zhipu Qingyan”插件来体验AutoGLM-Web,该插件能够模拟用户的网页浏览和点击行为,并自动完成高级搜索、总结和内容生成。此外,AutoGLM已在Android系统上开放了Beta测试申请,并与荣耀等手机制造商展开了深度合作。
技术背景
- 核心技术:AutoGLM基于Zhipu自主研发的“基础代理解耦中间接口”和“自我进化在线课程强化学习框架”,解决了大规模模型代理任务规划和动作执行中的能力冲突、训练任务和数据稀缺、反馈信号稀疏及策略分布漂移等问题。
- 技术优势:
- 解决了“动作执行”不精确、“任务规划”灵活性不足的问题,通过设计自然语言中间接口实现了“任务规划”与“动作执行”的解耦,大幅提升了代理能力。
- 引入了自我进化在线课程强化学习框架,在真实环境中不断学习和提升大规模模型代理的能力。
技术性能
- 性能表现:在Phone Use和Web Browser Use领域,AutoGLM的性能显著优于GPT-4o和Claude-3.5-Sonnet。
- 在AndroidLab评估基准测试中,AutoGLM的表现超越了GPT-4o和Claude-3.5-Sonnet。
- 在WebArena-Lite评估基准中,AutoGLM的性能提升了约200%,显著缩小了人类与大规模模型代理在GUI操作成功率上的差距。
展望
AutoGLM的推出标志着人工智能技术在“手机使用”领域的重大进步,使得AI应用更加贴近人们的日常生活。未来,随着更多深度合作和技术优化,AutoGLM有望进一步提升用户体验和智能化水平。
这份总结涵盖了AutoGLM的核心特点、应用场景、技术优势以及性能表现等方面的信息,为公司决策提供了详实的数据支持与深入分析。