AI-NEWS · 2025年 12月 17日

阿里万相2.6上线

阿里万相2.6发布:支持角色扮演与多镜头控制,单视频时长最高达15秒

2025年12月16日,阿里巴巴正式发布了新一代万相2.6系列模型。该模型针对专业影视制作与图像创作场景进行了全面升级,并被称为“全球功能最丰富的视频生成模型”。万相2.6已在阿里云百炼平台和万相官网同步上线。

核心升级与技术突破

此次升级进一步提升了画质、音效与指令跟随能力,并将单视频时长提升至国内最高的15秒。该模型家族现已支持超过10种视觉创作能力,包括文生图、图生图、文生视频、图生视频、音生视频、动作生成、角色扮演及通用视频编辑等。

1. 角色扮演功能(国内首创)

万相2.6能够参考输入视频中人物的外貌与声音,并根据提示词生成包含单角色、多角色或角色与物体互动的视频。

  • 技术原理:通义万相集成了多项创新技术,可对参考视频进行多模态联合建模与学习,提取情感状态、姿态、视觉特征以及语音、语速等声学特征,确保所有感官维度的一致性与迁移性。

2. 专业级镜头控制

模型新增镜头控制功能,可将简单的用户提示词转化为多镜头脚本,生成具有连贯叙事性的多镜头视频。

  • 能力体现:通过高层级语义理解,万相2.6能够构建具有完整故事线和叙事张力的专业级多镜头片段,同时在镜头间流畅切换时,保持核心主体、场景布局与环境氛围的高度一致性。

赋能影视级创作场景

万相2.6的角色扮演与镜头控制功能,极大地满足了专业影视级场景的需求。

  • 个人创作示例:普通用户上传个人视频并输入科幻悬疑风格的提示词,万相2.6可在数分钟内完成镜头设计、角色表演与语音配音,生成一部拥有完整叙事镜头和电影感运镜的短片。
  • 专业应用:对于广告设计、短剧制作等专业场景,通过输入连续提示词,模型可生成完整的叙事短片,降低创作门槛。

巩固国内领先地位

阿里巴巴此前已于2025年9月发布了音画同步视频生成模型万相2.5。在权威大模型评测集LMArena中,万相的图生视频能力已位列国内第一。2.6版本的发布进一步巩固了其在国内视频生成领域的领先地位

体验方式

自发布日起,任何用户均可直接在万相官网体验万相2.6。企业用户可通过阿里云百炼平台调用API。


信息来源:AIbase, 2025年12月16日。

火龙果频道