归纳总结
1. 新产品发布
- 产品名称: CogVideoX
- 公司: 智谱AI
- 功能: 新一代视频生成模型
- 体验方式: 可通过“清影”免费体验
2. 核心技术特点
- 三维变分自编码器结构(3D VAE)
- 压缩原始视频数据至原大小的2%
- 降低训练成本和难度
- 提升帧间关系捕捉能力,建立视频长期依赖关系
- 端到端视频理解模型
- 增强文本理解和指令遵循能力
- 能处理超长且复杂的prompt指令
- 三维一体融合的transformer架构
- 使用Expert Block对齐文本与视频模态空间
- Full Attention机制优化模态间交互效果
3. 用户体验
- 平台上线: 清言的PC端、移动应用端及小程序端
- 主要特点:
- 快速生成
- 高效的指令遵循能力
- 内容连贯性
- 画面调度灵活性
4. 开放平台
- 大模型开放平台: bigmodel.cn
- 功能调用: 企业和开发者可通过API调用使用清影功能
5. 未来发展
- 验证成果: Scaling Law在视频生成领域的有效性
- 发展计划: 持续扩大数据规模和模型规模,研究新型模型架构,更高效压缩视频信息,全面融合文本与视频内容
6. 体验地址
Source:https://www.aibase.com/news/10604