Kling AI 2.6 正式发布:原生音频与10秒1080P AI视频开启“音画时代”
核心发布要点
快手旗下AI视频生成模型Kling AI,于Omni生态系统周首日正式推出2.6版本。此次更新的核心突破在于首次引入了原生音频生成功能,标志着AI视频生成从“视觉”竞争扩展至“音画同步”的新阶段。
关键技术规格与性能提升
-
视频与音频:
- 视频输出:保持10秒、1080P高清生成。
- 音频生成:支持双语对话、歌唱及音效同步,实现“文本→视频→音频”一键生成闭环。官方口号“看见声音,听见画面”强调了其多模态同步能力。
-
成本与效率:
- 生成成本降低:现仅需25积分/5秒,较上一版本降低了30%。
-
技术架构与性能改进:
- 基于扩散Transformer加3D时空联合注意力架构,带来三项显著提升:
- 复杂指令遵循能力提升 15%。
- 跨镜头角色一致性达到当前SOTA(State-of-the-Art) 水平。
- 在盲测中表现优于Seedance 1.0模型 285%。
- 基于扩散Transformer加3D时空联合注意力架构,带来三项显著提升:
市场策略与未来规划
- 首发平台:将率先在Artlist等专业平台上线,提供场景扩展和多元素编辑API,主要瞄准电影、短剧、广告、MV制作等专业市场。
- 未来路线图:快手宣布,计划在2026年第一季度发布4K 60fps版本,并开放自定义音色库,持续降低“AI影视制作”门槛。
行业影响分析
- 填补关键空白:行业观察者认为,音频同步功能填补了AI视频生成的最后一块拼图。预计将使后期编辑流程缩短50% 以上。
- 竞争维度扩展:随着Kling 2.6的发布,AI创作工具的竞争正从“视觉”领域扩展至“声音”领域,可能引发一波新的音频类短视频内容供给浪潮。
- 行业成本趋势:此次版本更新在提升性能的同时显著降低了使用成本(-30%),这与同期其他厂商(如火山引擎的Doubao模型降价72%)的行动共同表明,AI视频生成的商业化进程正在加速,成本下降和效率提升是当前竞争的关键点。
近期AI视频行业动态摘要(背景参考)
- Runway:发布Gen-4.5视频生成模型,提升视觉准确性与创意控制。
- OpenAI Sora:面临用户留存挑战(首周安装量达百万,但60日留存率近零),并已启动商业化,缩减免费额度,推出付费套餐。
- Kuaishou Kling Omni:本周即将发布,宣称可实现导演级精准控制,生成带原生音频的2分钟长视频。
- 火山引擎:推出Doubao视频模型1.0 Pro Fast版本,速度提升3倍,价格降低72%。
- MiniMax:海螺2.3(Hailuo 2.3)即将发布,据称在真实感上超越Google Veo。
分析依据:AIbase Daily 发布于2025年12月3日的报道。
