AI-NEWS · 2025年 4月 23日

Vidu发布AI视频新模型

Vidu Q1 技术性能分析报告

核心参数概览

  • 分辨率支持:1080P(U-ViT架构优化)
  • 音频采样率:48 kHz(行业领先水平)
  • 模型架构:Universal Vision Transformer (U-ViT)
  • 基准测试表现
    • VBench-1.0/VBench-2.0 评测体系
    • SuperCLUE Q100测试通过

竞品对比数据

指标 Vidu Q1 Runway Gen-4 Veo 2
3D渲染能力
音频采样深度 48kHz 32kHz 16kHz
多模态处理 支持 部分支持 不支持

关键技术突破

  1. 音频处理

    • 支持16KHz/32KHz/48KHz三档采样率
    • 动态范围达到103dB(信噪比0.3%)
  2. 视觉架构

    • 采用改进型U-ViT框架
    • 相比前代Vidu 1.5提升80-90%渲染效率
  3. 多平台适配

    • 已推出iOS客户端(Vidu APP)
    • Web端访问入口:vidu.com

市场定位分析

  • 直接对标OpenAI Sora、Runway Gen系列
  • 在3D内容生成领域超越Runway Gen-3 Alpha 10%性能
  • 被标注为"10大AI视频生成工具"之一

待验证信息

  • 宣称的"16KHz-48KHz无损转换"技术需实测验证
  • 与GPT-4O的协同工作能力未披露细节
  • 企业级解决方案尚未公布定价策略

注:报告中所有时间戳00:00均表示功能演示节点,非具体时间参数

火龙果频道