AI-NEWS · 2025年 12月 16日

SenseTime Launches the Industry’s First Multi-Series Generative AI Agent Seko2.0, Domestic AI Chip Successfully Integrates the Full Multimodal AIGC Pipeline

商汤发布业界首个多系列生成式AI智能体Seko2.0,国产AI芯片成功集成全模态AIGC管线

发布日期: 2025年12月15日
来源: AIbase

核心摘要

商汤科技正式发布Seko 2.0,这是全球首个专注于多集视频生成的智能体。该发布标志着AI视频生成从单片段创作迈向了连续叙事的新阶段,并首次实现了与国产AI芯片(寒武纪)的全面兼容,完成了从语言大模型到多模态生成(尤其是高算力视频生成)的全流程国产化支持。

技术突破与核心功能

1. 多集连续视频生成

Seko 2.0能够生成具有高度一致性的多集短视频内容,在以下方面实现行业突破:

  • 情节连贯性: 支持基于故事大纲自动生成带对话的连续多集短视频序列。
  • 角色稳定性: 确保同一角色在不同剧集中保持外貌、服装乃至微表情的一致。
  • 视觉一致性: 维持场景和风格在多集中的统一。

2. 底层技术支撑

系统背后是商汤自研的“日日新Seko”系列多模态大模型的深度协作:

  • SekoIDX: 负责高精度图像生成与角色建模。
  • SekoTalk: 专注于语音驱动口型同步和带情感表达的视频合成。
  • 关键技术机制: 通过跨帧注意力机制和角色记忆模块,有效解决了当前AI视频工具常见的“换脸崩坏”和“剧情割裂”问题。

3. 国产化全链路闭环

本次发布最显著的突破在于硬件生态的整合:

  • 全兼容国产芯片: Seko系列模型已完成与国产AI芯片制造商寒武纪的全面兼容。
  • 意义: 这是国内计算平台首次完全支持核心AIGC生产场景(从语言模型到多模态生成),降低了对海外GPU的依赖,标志着国内AI生态“硬件-模型-应用”链条关键闭环的形成。

应用场景与价值

  • 目标场景: 为短剧、广告、教育等场景提供可规模化的AI内容生产解决方案。
  • 对开发者/创作者的价值: 不仅是一个效率工具,更是一种新的内容范式。输入故事梗概,AI即可自动产出连贯的多集短视频。
  • 安全与自主需求: 借助国产芯片的部署能力,此能力可延伸至本地化、私有化场景,满足对数据安全与自主性有要求的政务、金融、媒体机构的需求。

行业意义

从单帧图像到连续剧集,从通用生成到角色记忆,从依赖进口算力到全面兼容国产芯片,商汤Seko 2.0的发布既是技术演进的里程碑,也是中国AI产业链协同创新的关键验证。当AI开始“记住角色”并“讲述长故事”,视觉内容的工业化生产时代可能真正到来。


注:原始材料中提及的其他AI新闻(如通义千问校园应用、全球AI竞争力排名等)与本核心主题无关,已按指令过滤。本文仅整理并呈现与商汤Seko 2.0直接相关的信息。

火龙果频道