AI-NEWS · 2025年 12月 4日

Kling 2.6发布：AI视频音频时代

Kling AI 2.6 正式发布：原生音频与10秒1080P AI视频开启“音画时代”

核心发布要点

快手旗下AI视频生成模型Kling AI，于Omni生态系统周首日正式推出2.6版本。此次更新的核心突破在于首次引入了原生音频生成功能，标志着AI视频生成从“视觉”竞争扩展至“音画同步”的新阶段。

关键技术规格与性能提升

视频与音频：
- 视频输出：保持10秒、1080P高清生成。
- 音频生成：支持双语对话、歌唱及音效同步，实现“文本→视频→音频”一键生成闭环。官方口号“看见声音，听见画面”强调了其多模态同步能力。
成本与效率：
- 生成成本降低：现仅需25积分/5秒，较上一版本降低了30%。
技术架构与性能改进：
- 基于扩散Transformer加3D时空联合注意力架构，带来三项显著提升：
  - 复杂指令遵循能力提升 15%。
  - 跨镜头角色一致性达到当前SOTA（State-of-the-Art） 水平。
  - 在盲测中表现优于Seedance 1.0模型 285%。

市场策略与未来规划

首发平台：将率先在Artlist等专业平台上线，提供场景扩展和多元素编辑API，主要瞄准电影、短剧、广告、MV制作等专业市场。
未来路线图：快手宣布，计划在2026年第一季度发布4K 60fps版本，并开放自定义音色库，持续降低“AI影视制作”门槛。

行业影响分析

填补关键空白：行业观察者认为，音频同步功能填补了AI视频生成的最后一块拼图。预计将使后期编辑流程缩短50% 以上。
竞争维度扩展：随着Kling 2.6的发布，AI创作工具的竞争正从“视觉”领域扩展至“声音”领域，可能引发一波新的音频类短视频内容供给浪潮。
行业成本趋势：此次版本更新在提升性能的同时显著降低了使用成本（-30%），这与同期其他厂商（如火山引擎的Doubao模型降价72%）的行动共同表明，AI视频生成的商业化进程正在加速，成本下降和效率提升是当前竞争的关键点。

近期AI视频行业动态摘要（背景参考）

Runway：发布Gen-4.5视频生成模型，提升视觉准确性与创意控制。
OpenAI Sora：面临用户留存挑战（首周安装量达百万，但60日留存率近零），并已启动商业化，缩减免费额度，推出付费套餐。
Kuaishou Kling Omni：本周即将发布，宣称可实现导演级精准控制，生成带原生音频的2分钟长视频。
火山引擎：推出Doubao视频模型1.0 Pro Fast版本，速度提升3倍，价格降低72%。
MiniMax：海螺2.3（Hailuo 2.3）即将发布，据称在真实感上超越Google Veo。

分析依据：AIbase Daily 发布于2025年12月3日的报道。

火龙果频道

您可能还喜欢...