AI-NEWS · 2025年 7月 19日

LTX-Video 13B发布

LTX-Video13B：开源视频生成技术新突破

核心技术创新

多尺度渲染技术：采用先低分辨率生成运动框架，再逐步细化细节的创新流程
13B参数规模：基于DiT（Diffusion Transformer）架构构建
30倍速度提升：5秒视频仅需2秒生成（同类模型对比）
消费级硬件适配：可在NVIDIA RTX4090等消费级GPU流畅运行

关键技术指标

参数	性能表现
分辨率支持	1216×704
帧率	30FPS实时生成
内存占用	较传统模型降低40%
数据格式	bfloat16优化

创作控制功能

精准控制维度：
- 关键帧控制
- 角色/摄像机运动
- 多机位组合
创意扩展功能：
- 视频延长（最长60秒）
- 风格转换（如真人转动画）
- 动作替换

开源生态建设

模型获取：GitHub/Hugging Face免费开源
训练工具：
- LTX-Video-Trainer支持全参数微调
- 支持LoRA轻量化训练（2B/13B版本）
兼容性：完美适配ComfyUI工作流
普惠政策：年收入<1000万的组织可免费商用

行业影响

打破专业设备依赖：使中小团队获得电影级制作能力
应用场景扩展：
- 短视频创作（占测试用例63%）
- 广告制作（生成效率提升22倍）
- 教育可视化（细节准确度达92%）

发展路线图

2025Q3：增加物理引擎支持
2025Q4：实现多模态控制
2026：目标支持4K视频生成

技术文档获取：官网 | GitHub仓库

火龙果频道

您可能还喜欢...