字节跳动发布AI视频模型Waver 1.0,支持多艺术风格视频生成
模型概览
字节跳动于2025年8月27日正式发布新一代AI视频生成模型Waver 1.0。该模型是一个多功能视频生成解决方案,具备以下核心特性:
- 输入支持:支持文本到视频(text-to-video)和图像到视频(image-to-video)转换
- 生成时长:支持生成最长10秒的视频内容
- 质量表现:在视频生成质量和效果方面显著优于现有开源和闭源模型
技术性能表现
根据官方评估数据,Waver 1.0在以下测试集表现突出:
- Waver-Bench 1.0:综合性能评估基准
- Hermes Motion Testset:运动质量专项测试集
人工评估显示,该模型在以下三个关键维度展现优势:
- 运动质量(motion quality)
- 视觉质量(visual quality)
- 提示词跟随能力(prompt following)
核心功能特性
多镜头叙事能力
Waver 1.0具备生成多镜头叙事视频的能力,在镜头切换和时空转换过程中能够保持:
- 核心主题一致性
- 视觉风格统一性
- 整体氛围连贯性
多样化艺术风格支持
模型支持生成多种艺术风格的视频内容,包括:
- 超写实风格(ultra-realistic)
- 动画风格(animation)
- 黏土风格(clay)
- 毛绒风格(plush)
运动生成能力
- 在体育场景中表现出良好的运动生成能力
- 已扩展动物运动生成功能
- 部分复杂运动场景仍需进一步优化
行业意义
Waver 1.0的发布为用户提供了全新的创意表达工具,推动了人工智能生成内容(AIGC)领域的发展,使创作者能够更便捷地实现视频创作想法。