AI-NEWS · 2025年 7月 22日

京东开源JoyAgent

京东开源多智能体系统JoyAgent-JDGenie:GAIA基准测试表现优异

核心亮点

  • GAIA基准测试领先:整体准确率达75.15,超越OWL(约65)和OpenManus(约65)
    • Level 1任务:>85%准确率
    • Level 2任务:~78%准确率
    • Level 3复杂任务:55%准确率
  • 端到端设计:集成前端、后端、核心引擎及多个子智能体模块
  • 多模态支持:可处理文本、图像、代码等多种数据形式

技术架构

  1. 模块化设计

    • 包含报告生成、代码、PPT、文件处理等子智能体
    • 支持通过Web搜索API/Python解释器等扩展功能
  2. 协作机制

    • 多层任务分解架构
    • 示例:输入"生成2025年AI趋势PPT"时,自动分配任务给PPT智能体和数据分析智能体
  3. 记忆优化

    • 跨任务级相似任务记忆机制
    • 处理重复报告时可减少30%冗余计算

开源生态

  • 许可证:Apache 2.0
  • 开放内容
    • 完整前后端代码
    • 框架引擎核心代码
    • 详细文档和快速入门指南
  • 平台支持:Windows/Linux,兼容主流硬件

应用场景

  • 数据分析和可视化
  • 自动化文档生成
  • 智能客服系统
  • 跨模态信息处理(如同时解析绘画与历史记录)

发展路线

  • 即将增加本地LLM支持
  • 开发更高效的推理加速技术
  • 计划降低对云API的依赖

注:GAIA基准因强调多模态处理、工具使用和复杂推理等现实任务,被视为评估AI智能体能力的"黄金标准"

火龙果频道