AI-NEWS · 2024年 7月 26日

智谱AI推出新一代视频生成模型CogVideoX 可通过「清影」免费体验

归纳总结

1. 新产品发布

  • 产品名称: CogVideoX
  • 公司: 智谱AI
  • 功能: 新一代视频生成模型
  • 体验方式: 可通过“清影”免费体验

2. 核心技术特点

  • 三维变分自编码器结构(3D VAE)
    • 压缩原始视频数据至原大小的2%
    • 降低训练成本和难度
    • 提升帧间关系捕捉能力,建立视频长期依赖关系
  • 端到端视频理解模型
    • 增强文本理解和指令遵循能力
    • 能处理超长且复杂的prompt指令
  • 三维一体融合的transformer架构
    • 使用Expert Block对齐文本与视频模态空间
    • Full Attention机制优化模态间交互效果

3. 用户体验

  • 平台上线: 清言的PC端、移动应用端及小程序端
  • 主要特点:
    • 快速生成
    • 高效的指令遵循能力
    • 内容连贯性
    • 画面调度灵活性

4. 开放平台

  • 大模型开放平台: bigmodel.cn
  • 功能调用: 企业和开发者可通过API调用使用清影功能

5. 未来发展

  • 验证成果: Scaling Law在视频生成领域的有效性
  • 发展计划: 持续扩大数据规模和模型规模,研究新型模型架构,更高效压缩视频信息,全面融合文本与视频内容

6. 体验地址

Source:https://www.aibase.com/news/10604