AI-NEWS · 2025年 7月 19日

LTX-Video 13B发布

LTX-Video13B:开源视频生成技术新突破

核心技术创新

  • 多尺度渲染技术:采用先低分辨率生成运动框架,再逐步细化细节的创新流程
  • 13B参数规模:基于DiT(Diffusion Transformer)架构构建
  • 30倍速度提升:5秒视频仅需2秒生成(同类模型对比)
  • 消费级硬件适配:可在NVIDIA RTX4090等消费级GPU流畅运行

关键技术指标

参数 性能表现
分辨率支持 1216×704
帧率 30FPS实时生成
内存占用 较传统模型降低40%
数据格式 bfloat16优化

创作控制功能

  1. 精准控制维度
    • 关键帧控制
    • 角色/摄像机运动
    • 多机位组合
  2. 创意扩展功能
    • 视频延长(最长60秒)
    • 风格转换(如真人转动画)
    • 动作替换

开源生态建设

  • 模型获取:GitHub/Hugging Face免费开源
  • 训练工具
    • LTX-Video-Trainer支持全参数微调
    • 支持LoRA轻量化训练(2B/13B版本)
  • 兼容性:完美适配ComfyUI工作流
  • 普惠政策:年收入<1000万的组织可免费商用

行业影响

  1. 打破专业设备依赖:使中小团队获得电影级制作能力
  2. 应用场景扩展:
    • 短视频创作(占测试用例63%)
    • 广告制作(生成效率提升22倍)
    • 教育可视化(细节准确度达92%)

发展路线图

  • 2025Q3:增加物理引擎支持
  • 2025Q4:实现多模态控制
  • 2026:目标支持4K视频生成

技术文档获取:官网 | GitHub仓库

火龙果频道