AI-NEWS · 2025年 4月 4日

照片变视频人物

DreamActor-M1 Runway Act 技术分析报告

核心产品概述

DreamActor-M1是一款基于Diffusion Transformer(DiT)架构的AI视频生成系统，专注于实现高精度人物动作与外观控制。

关键技术特性

1. 混合运动引导系统

3D身体骨骼：提供精确的肢体动作控制
3D头部球体：实现头部运动的自然模拟
隐式面部特征：保留人物独特面部特征

2. 外观引导技术

支持多维度外观参数控制
保持人物形象一致性

3. 扩散Transformer架构(DiT)

采用三种注意力机制：
- 面部注意力(Face Attention)
- 自注意力(Self Attention)
- 参考注意力(Reference Attention)

性能表现

时间一致性(Temporal Coherence)表现优异
可控性(Controllability)达到行业领先水平
被标注为"SOTA"(State Of The Art)技术

交互功能

提供完整的视频播放控制：
- 多档播放速度(0.5x-2x)
- 画质调整
- 全屏/PIP模式
- 字幕控制

技术亮点

实现了人物动作与外观的解耦控制
在保持人物身份特征的同时实现自然动作
基于Transformer架构的扩散模型创新

潜在应用场景

影视特效制作
虚拟主播生成
游戏角色动画
广告内容生产

注：报告中所有技术参数均来自原始材料分析，发布时间为15小时前(2025-04-03)。

火龙果频道

您可能还喜欢...