阿里万相2.6发布：支持角色扮演与多镜头控制，单视频时长最高达15秒

2025年12月16日，阿里巴巴正式发布了新一代万相2.6系列模型。该模型针对专业影视制作与图像创作场景进行了全面升级，并被称为“全球功能最丰富的视频生成模型”。万相2.6已在阿里云百炼平台和万相官网同步上线。

核心升级与技术突破

此次升级进一步提升了画质、音效与指令跟随能力，并将单视频时长提升至国内最高的15秒。该模型家族现已支持超过10种视觉创作能力，包括文生图、图生图、文生视频、图生视频、音生视频、动作生成、角色扮演及通用视频编辑等。

万相2.6能够参考输入视频中人物的外貌与声音，并根据提示词生成包含单角色、多角色或角色与物体互动的视频。

技术原理：通义万相集成了多项创新技术，可对参考视频进行多模态联合建模与学习，提取情感状态、姿态、视觉特征以及语音、语速等声学特征，确保所有感官维度的一致性与迁移性。

模型新增镜头控制功能，可将简单的用户提示词转化为多镜头脚本，生成具有连贯叙事性的多镜头视频。

能力体现：通过高层级语义理解，万相2.6能够构建具有完整故事线和叙事张力的专业级多镜头片段，同时在镜头间流畅切换时，保持核心主体、场景布局与环境氛围的高度一致性。

万相2.6的角色扮演与镜头控制功能，极大地满足了专业影视级场景的需求。

个人创作示例：普通用户上传个人视频并输入科幻悬疑风格的提示词，万相2.6可在数分钟内完成镜头设计、角色表演与语音配音，生成一部拥有完整叙事镜头和电影感运镜的短片。
专业应用：对于广告设计、短剧制作等专业场景，通过输入连续提示词，模型可生成完整的叙事短片，降低创作门槛。

阿里巴巴此前已于2025年9月发布了音画同步视频生成模型万相2.5。在权威大模型评测集LMArena中，万相的图生视频能力已位列国内第一。2.6版本的发布进一步巩固了其在国内视频生成领域的领先地位。

自发布日起，任何用户均可直接在万相官网体验万相2.6。企业用户可通过阿里云百炼平台调用API。

信息来源：AIbase， 2025年12月16日。