京东开源多智能体系统JoyAgent-JDGenie:GAIA基准测试表现优异
核心亮点
- GAIA基准测试领先:整体准确率达75.15,超越OWL(约65)和OpenManus(约65)
- Level 1任务:>85%准确率
- Level 2任务:~78%准确率
- Level 3复杂任务:55%准确率
- 端到端设计:集成前端、后端、核心引擎及多个子智能体模块
- 多模态支持:可处理文本、图像、代码等多种数据形式
技术架构
-
模块化设计:
- 包含报告生成、代码、PPT、文件处理等子智能体
- 支持通过Web搜索API/Python解释器等扩展功能
-
协作机制:
- 多层任务分解架构
- 示例:输入"生成2025年AI趋势PPT"时,自动分配任务给PPT智能体和数据分析智能体
-
记忆优化:
- 跨任务级相似任务记忆机制
- 处理重复报告时可减少30%冗余计算
开源生态
- 许可证:Apache 2.0
- 开放内容:
- 完整前后端代码
- 框架引擎核心代码
- 详细文档和快速入门指南
- 平台支持:Windows/Linux,兼容主流硬件
应用场景
- 数据分析和可视化
- 自动化文档生成
- 智能客服系统
- 跨模态信息处理(如同时解析绘画与历史记录)
发展路线
- 即将增加本地LLM支持
- 开发更高效的推理加速技术
- 计划降低对云API的依赖
注:GAIA基准因强调多模态处理、工具使用和复杂推理等现实任务,被视为评估AI智能体能力的"黄金标准"