昆仑万维SkyReels-V3开源,实现多模态视频生成技术突破
发布日期:2026年1月29日
来源:AIbase
核心摘要
2026年1月29日,Skywork AI正式开源了其自主研发的“全能型”视频生成大模型——SkyReels-V3。该模型的发布标志着视频生成技术进入了一个高保真、多模态的新阶段,通过单一建模架构,深度融合了图生视频、视频延展和音频驱动虚拟人像三大核心功能。
技术亮点与功能
1. 图生视频
- 功能:支持输入1至4张参考图像。
- 效果:能准确保留主体身份特征与空间构图。
- 性能数据:在参考一致性和视觉质量指标上表现出色,评测显示其性能超越了Vidu Q2、Kling1.6等主流商业模型。
2. 视频延展
- 解决的问题:针对视频创作的时长与叙事连贯性问题。
- 功能升级:不仅支持简单的视角延续,还引入了“镜头转场延展模式”。
- 技术特点:融入了切入、前后景等专业电影转场技法,使AI生成的视频从简单的“时间延展”升级为具有逻辑的“叙事延展”。
3. 音频驱动虚拟人像
- 功能:通过精准的音频-视频对齐技术,实现了高唇形同步率。
- 支持能力:支持分钟级长视频生成与多角色互动。
- 应用场景:为数字人直播、在线教育等场景提供了更自然的交互体验。
开源与生态
目前,SkyReels-V3已在GitHub上正式开源,并提供限时免费的API调用服务。Skywork AI表示,将继续聚焦“All in AGI and AIGC”战略,通过开源推动AI视频创作生态的繁荣。
GitHub地址:SkyReels-V3
(本文内容经整理,移除了原始材料中的导航栏、广告、重复新闻条目及其他无关信息。)
