AI-NEWS · 2025年 7月 23日

南大北大联手开源WORLDMEM

WORLDMEM：开源长记忆世界模型突破虚拟环境一致性难题

研究背景

由南洋理工大学、北京大学王选计算机研究所和上海人工智能实验室联合开发
旨在解决虚拟环境中的长期一致性问题，特别是视角变化或时间流逝时的3D空间连贯性

核心技术

创新记忆机制

构建包含多个记忆单元的存储库
每个单元存储特定时间的场景信息和状态数据
突破传统短期上下文窗口的限制，实现长期环境细节保留

场景生成能力

从大型记忆库中快速检索最相关信息
通过复杂推理和匹配确保信息与当前时间/视角/场景状态对齐
示例：虚拟角色返回原点时能快速找回先前记忆帧

动态更新特性

随虚拟世界演化持续更新记忆库
采用基于条件扩散变换器的架构
支持第一人称视角生成，实现灵活移动和交互

训练技术

使用扩散强迫技术进行训练
实现跨时间的长期模拟
通过动作信号嵌入和去噪时间步嵌入增强对动作指令的响应

应用价值

为虚拟现实应用提供重要技术支持
显著提升场景生成质量和用户体验

关键数据

模型类型：开源长记忆世界模型
核心突破：传统方法局限 vs 新型记忆机制
训练方式：扩散强迫技术 + 条件扩散变换器架构

火龙果频道

您可能还喜欢...