AI-NEWS · 2025年 2月 19日

LeCun:AI视频学物理

Meta AI研究突破:V-JEPA模型通过视频学习物理直觉

研究背景

由Meta首席AI科学家Yann LeCun领衔,联合巴黎大学、EHESS的团队发现:AI系统可通过自监督视频学习获得物理直觉,无需预设规则。该研究颠覆了传统AI需内置"核心知识"的假设,模拟人类婴儿认知发展路径。

核心发现

  1. 学习效率突破

    • 仅需观看128小时视频即掌握基础物理概念
    • 1.15亿参数小模型即展现优异性能(对比千亿级大模型)
  2. 物理理解能力

    • 物体恒存性(Object Permanence)准确率92.3%
    • 运动连续性(Continuity)识别率87.6%
    • 形状一致性(Shape Consistency)判断力89.1%

技术突破:V-JEPA架构

特性 传统生成模型 V-JEPA模型
学习方式 像素级重建 抽象表征空间预测
能耗效率 高计算消耗 低资源需求
物理矛盾识别能力 随机猜测水平 系统化检测能力

对比实验数据

在三大测试集表现:

  • IntPhys(基础物理):V-JEPA准确率超基准模型63%
  • GRASP(复杂交互):动作模式识别率78.4%
  • InfLevel(真实环境):物理异常检测F1值85.2%

研究意义

  1. 认知科学验证:采用发展心理学"预期违背"范式,首次实现AI与人类婴儿认知实验方法论的统一
  2. 产业应用前景:为具身智能、物理仿真引擎提供新范式,Meta计划延伸开发:
    • 多模态世界模型
    • 自主环境交互系统
    • 开放式物理推理框架

关键数据汇总

指标 数值
视频训练时长 128小时
最小有效参数量 1.15亿
物理矛盾检测准确率 91.7%
学习效率提升倍数 较传统方法×6.8

该研究标志着AI从符号推理向直觉认知的范式转变,为构建真正理解物理世界的通用人工智能奠定基础。

火龙果频道