AI-NEWS · 2025年 4月 23日

Vidu发布AI视频新模型

Vidu Q1 技术性能分析报告

核心参数概览

分辨率支持：1080P（U-ViT架构优化）
音频采样率：48 kHz（行业领先水平）
模型架构：Universal Vision Transformer (U-ViT)
基准测试表现：
- VBench-1.0/VBench-2.0 评测体系
- SuperCLUE Q100测试通过

竞品对比数据

指标	Vidu Q1	Runway Gen-4	Veo 2
3D渲染能力	✓	✓	✓
音频采样深度	48kHz	32kHz	16kHz
多模态处理	支持	部分支持	不支持

关键技术突破

音频处理：
- 支持16KHz/32KHz/48KHz三档采样率
- 动态范围达到103dB（信噪比0.3%）
视觉架构：
- 采用改进型U-ViT框架
- 相比前代Vidu 1.5提升80-90%渲染效率
多平台适配：
- 已推出iOS客户端（Vidu APP）
- Web端访问入口：vidu.com

市场定位分析

直接对标OpenAI Sora、Runway Gen系列
在3D内容生成领域超越Runway Gen-3 Alpha 10%性能
被标注为"10大AI视频生成工具"之一

待验证信息

宣称的"16KHz-48KHz无损转换"技术需实测验证
与GPT-4O的协同工作能力未披露细节
企业级解决方案尚未公布定价策略

注：报告中所有时间戳00:00均表示功能演示节点，非具体时间参数

火龙果频道

您可能还喜欢...