商汤发布业界首个多系列生成式AI智能体Seko2.0,国产AI芯片成功集成全模态AIGC管线
发布日期: 2025年12月15日
来源: AIbase
核心摘要
商汤科技正式发布Seko 2.0,这是全球首个专注于多集视频生成的智能体。该发布标志着AI视频生成从单片段创作迈向了连续叙事的新阶段,并首次实现了与国产AI芯片(寒武纪)的全面兼容,完成了从语言大模型到多模态生成(尤其是高算力视频生成)的全流程国产化支持。
技术突破与核心功能
1. 多集连续视频生成
Seko 2.0能够生成具有高度一致性的多集短视频内容,在以下方面实现行业突破:
- 情节连贯性: 支持基于故事大纲自动生成带对话的连续多集短视频序列。
- 角色稳定性: 确保同一角色在不同剧集中保持外貌、服装乃至微表情的一致。
- 视觉一致性: 维持场景和风格在多集中的统一。
2. 底层技术支撑
系统背后是商汤自研的“日日新Seko”系列多模态大模型的深度协作:
- SekoIDX: 负责高精度图像生成与角色建模。
- SekoTalk: 专注于语音驱动口型同步和带情感表达的视频合成。
- 关键技术机制: 通过跨帧注意力机制和角色记忆模块,有效解决了当前AI视频工具常见的“换脸崩坏”和“剧情割裂”问题。
3. 国产化全链路闭环
本次发布最显著的突破在于硬件生态的整合:
- 全兼容国产芯片: Seko系列模型已完成与国产AI芯片制造商寒武纪的全面兼容。
- 意义: 这是国内计算平台首次完全支持核心AIGC生产场景(从语言模型到多模态生成),降低了对海外GPU的依赖,标志着国内AI生态“硬件-模型-应用”链条关键闭环的形成。
应用场景与价值
- 目标场景: 为短剧、广告、教育等场景提供可规模化的AI内容生产解决方案。
- 对开发者/创作者的价值: 不仅是一个效率工具,更是一种新的内容范式。输入故事梗概,AI即可自动产出连贯的多集短视频。
- 安全与自主需求: 借助国产芯片的部署能力,此能力可延伸至本地化、私有化场景,满足对数据安全与自主性有要求的政务、金融、媒体机构的需求。
行业意义
从单帧图像到连续剧集,从通用生成到角色记忆,从依赖进口算力到全面兼容国产芯片,商汤Seko 2.0的发布既是技术演进的里程碑,也是中国AI产业链协同创新的关键验证。当AI开始“记住角色”并“讲述长故事”,视觉内容的工业化生产时代可能真正到来。
注:原始材料中提及的其他AI新闻(如通义千问校园应用、全球AI竞争力排名等)与本核心主题无关,已按指令过滤。本文仅整理并呈现与商汤Seko 2.0直接相关的信息。
