AI-NEWS · 2025年 7月 26日

南大与上AI发布PhysX-3D

3D生成技术突破物理壁垒:PhysX-3D项目为AI注入"物理灵魂"

核心问题:当前AI生成3D模型的局限性

  • 现象:现有AI生成的3D世界常呈现"塑料感"
  • 根本原因:缺乏对物理属性的建模(重量、硬度、材料特性等)
  • 影响领域:物理模拟、机器人抓取、具身智能等硬核应用场景

PhysX-3D项目的创新突破

五大核心物理维度框架

  1. 绝对尺寸:精确区分1.8米衣柜与18厘米模型
  2. 材料属性:识别玻璃/金属/海绵等材料的密度、硬度、弹性
  3. 功能可供性:理解物体核心功能与高频接触部位(如椅子的坐面与靠背)
  4. 运动学特征:分析可动部件、运动方式、范围及组件层级关系
  5. 功能描述:用自然语言解释物体用途

全球首个物理标注数据集PhysXNet

  • 规模:26,000+精细标注3D对象(扩展版达600万+)
  • 标注流程
    • GPT-4o等AI系统进行初步自动标注
    • 人类专家复核优化
    • 复杂运动学参数采用"接触面计算→平面拟合→运动轴生成"的精确流程

PhysXGen生成框架技术架构

双分支设计

分支类型 功能 类比
结构分支 继承几何生成能力,创建形状与纹理 "皮肤"
物理分支 新增模块,学习生成五大物理属性 "灵魂"

技术亮点

  • 通过潜在空间对齐实现深度整合
  • 逐步学习几何特征与物理属性的内在关联

实验成果

定量比较

  • 几何质量:保持预训练模型优势并有所提升
  • 物理预测:五大维度全面超越基线方法
    • 材料预测误差降低64%
    • 功能可供性误差降低72%

典型案例

  1. 水龙头模型:准确生成旋转关节与组件层级关系
  2. 办公椅:精确预测海绵/布料材质及靠背旋转特性

行业影响

  • 范式转变:从纯几何建模转向物理基础建模
  • 应用领域
    • 机器人技术
    • 自动驾驶
    • 虚拟现实

未来挑战

  • 现实物体尺寸的长尾分布问题
  • 复杂运动学关系的精确定义
  • 虚拟与真实间的技术鸿沟

技术展望:AI将从虚拟世界的"造梦者"进化为遵循物理法则的3D世界"建造师"

火龙果频道