AI-NEWS · 2025年 7月 28日

告别分镜！Vidu革新视频制作

生数科技在WAIC 2025发布"参考视频"功能，革新视频制作流程

核心功能：告别分镜，一键生成视频

功能亮点：跳过复杂的前期分镜流程
操作流程：
- 用户上传人物/道具/场景参考图 + 文字提示
- 直接生成完整视频内容
流程简化：
- 传统流程：分镜→视频生成→剪辑→成品
- 新流程：参考图→视频生成→剪辑→成品

示例：输入提示词"诸葛亮与丘吉尔、拿破仑在会议室讨论"，上传三位历史人物和会议室场景参考图，系统可生成完整对话视频。

Anthropomorphic Rabbit Playing Flute Animated Movie

商业化核心突破

解决关键瓶颈：主体一致性问题
技术参数：
- 支持同时输入最多7个主体
- 满足大多数创意场景需求
应用场景：广告/动画/影视/文旅/教育等领域
产业转型：从线下拍摄转向线上AI创作

技术路径与产业定位

技术架构：U-ViT架构（扩散模型+Transformer）
模型特点：
- 内置多模态理解能力
- 已成功应用于视频生成
产业优先：更关注内容质量而非技术路线

具身智能领域拓展

联合发布：7月25日与清华大学共同推出Vidar模型
技术突破：
- "视频大模型+具身智能"路径
- 实现低成本、少样本泛化
底层逻辑：
- 视频模型与具身智能均处理时空信息
- 共享输入决策逻辑
应用前景：
- 将虚拟视频转化为机械臂动作
- 解决传统VLA方法数据稀缺问题

当前重点：优先提升视频生成能力，具身智能作为持续探索方向。

火龙果频道

您可能还喜欢...