阿里云百炼与千问云上线通义万相 HappyHorse 1.1:视频生成能力实现系统性升级
阿里巴巴最近把视频生成模型 HappyHorse 1.1 放出来了。相比 1.0 版本,这次在好几个核心指标上都有明显提升,感觉这个模型在生成式 AI 视频领域的竞争力确实变强了。
到底提升了什么?
跟 1.0 比,1.1 主要在这么几个方面变好了:
- 动作看着更顺了:不再是那种机械的顿挫感,细节也更丰富。
- 画面里的人/物不“跳戏”了:以前视频里人物或者物体容易突然变形、闪烁,现在特征保持得比较稳。
- 听指挥更准了:你给复杂的文字指令,它能理解并执行得更到位。
- 画面看着像真拍的:细腻度上来,没那么假,接近实拍质感。
- 声音跟画面对上号了:口型、音效跟动作匹配得挺准,沉浸感有了。
技术上是咋做到的?
公开信息里说,这次优化主要盯上了这几个技术点:
- 动作连贯性:改进了时序建模和物理约束。简单说,就是让视频帧跟帧之间更平滑,解决了以前那种动作突然“跳”的问题。
- 主体一致性:用了跨帧特征锁定和对象追踪技术。不管视频放多久,主角(比如人、车)长啥样基本不变。
- 听懂复杂指令:结合了大语言模型(比如 Qwen 系列)来解析语义。现在它能处理更长的指令,还能同时满足好几个条件。
- 音画同步:优化了算法,背景音、人声、音效生成得更自然,实现了“所见即所听”。
去哪用?
你不用等它离线部署,直接就能用。目前这几个地方都集成了:
- HappyHorse 官方网站
- 阿里云百炼(Aliyun Bailian)
- 千问云(Qianwen Cloud)
开发者、做内容的、还有企业用户,现在都能直接调用了。
这到底意味着啥?
这次升级确实让体验好点了,但也给行业竖了个新标杆:
- 对开发者:API 更好用,工具链也更顺手了。
- 对创作者:做视频的门槛低了不少,从有个想法到成片快多了。
- 对企业:营销视频、虚拟人、游戏素材这些,生产速度能快不少。
HappyHorse 1.1 的发布,算是阿里在 AIGC 视频这块儿又投入了一笔,也让它在国产大模型竞争里站稳了脚跟。
注:以上信息基于公开资料整理。
