AI-NEWS · 2025年 12月 4日

Kling 2.6发布:AI视频音频时代

Kling AI 2.6 正式发布:原生音频与10秒1080P AI视频开启“音画时代”

核心发布要点

快手旗下AI视频生成模型Kling AI,于Omni生态系统周首日正式推出2.6版本。此次更新的核心突破在于首次引入了原生音频生成功能,标志着AI视频生成从“视觉”竞争扩展至“音画同步”的新阶段。

关键技术规格与性能提升

  1. 视频与音频

    • 视频输出:保持10秒、1080P高清生成。
    • 音频生成:支持双语对话、歌唱及音效同步,实现“文本→视频→音频”一键生成闭环。官方口号“看见声音,听见画面”强调了其多模态同步能力。
  2. 成本与效率

    • 生成成本降低:现仅需25积分/5秒,较上一版本降低了30%
  3. 技术架构与性能改进

    • 基于扩散Transformer加3D时空联合注意力架构,带来三项显著提升:
      • 复杂指令遵循能力提升 15%
      • 跨镜头角色一致性达到当前SOTA(State-of-the-Art) 水平。
      • 在盲测中表现优于Seedance 1.0模型 285%

市场策略与未来规划

  1. 首发平台:将率先在Artlist等专业平台上线,提供场景扩展和多元素编辑API,主要瞄准电影、短剧、广告、MV制作等专业市场。
  2. 未来路线图:快手宣布,计划在2026年第一季度发布4K 60fps版本,并开放自定义音色库,持续降低“AI影视制作”门槛。

行业影响分析

  1. 填补关键空白:行业观察者认为,音频同步功能填补了AI视频生成的最后一块拼图。预计将使后期编辑流程缩短50% 以上。
  2. 竞争维度扩展:随着Kling 2.6的发布,AI创作工具的竞争正从“视觉”领域扩展至“声音”领域,可能引发一波新的音频类短视频内容供给浪潮
  3. 行业成本趋势:此次版本更新在提升性能的同时显著降低了使用成本(-30%),这与同期其他厂商(如火山引擎的Doubao模型降价72%)的行动共同表明,AI视频生成的商业化进程正在加速,成本下降和效率提升是当前竞争的关键点

近期AI视频行业动态摘要(背景参考)

  • Runway:发布Gen-4.5视频生成模型,提升视觉准确性与创意控制。
  • OpenAI Sora:面临用户留存挑战(首周安装量达百万,但60日留存率近零),并已启动商业化,缩减免费额度,推出付费套餐。
  • Kuaishou Kling Omni:本周即将发布,宣称可实现导演级精准控制,生成带原生音频的2分钟长视频。
  • 火山引擎:推出Doubao视频模型1.0 Pro Fast版本,速度提升3倍,价格降低72%。
  • MiniMax:海螺2.3(Hailuo 2.3)即将发布,据称在真实感上超越Google Veo。

分析依据:AIbase Daily 发布于2025年12月3日的报道。

火龙果频道