AI-NEWS · 2025年 7月 23日

南大北大联手开源WORLDMEM

WORLDMEM:开源长记忆世界模型突破虚拟环境一致性难题

研究背景

  • 由南洋理工大学、北京大学王选计算机研究所和上海人工智能实验室联合开发
  • 旨在解决虚拟环境中的长期一致性问题,特别是视角变化或时间流逝时的3D空间连贯性

核心技术

创新记忆机制

  • 构建包含多个记忆单元的存储库
  • 每个单元存储特定时间的场景信息和状态数据
  • 突破传统短期上下文窗口的限制,实现长期环境细节保留

场景生成能力

  • 从大型记忆库中快速检索最相关信息
  • 通过复杂推理和匹配确保信息与当前时间/视角/场景状态对齐
  • 示例:虚拟角色返回原点时能快速找回先前记忆帧

动态更新特性

  • 随虚拟世界演化持续更新记忆库
  • 采用基于条件扩散变换器的架构
  • 支持第一人称视角生成,实现灵活移动和交互

训练技术

  • 使用扩散强迫技术进行训练
  • 实现跨时间的长期模拟
  • 通过动作信号嵌入和去噪时间步嵌入增强对动作指令的响应

应用价值

  • 为虚拟现实应用提供重要技术支持
  • 显著提升场景生成质量和用户体验

关键数据

  • 模型类型:开源长记忆世界模型
  • 核心突破:传统方法局限 vs 新型记忆机制
  • 训练方式:扩散强迫技术 + 条件扩散变换器架构

火龙果频道