盛书科技发布Vidu 1.5，攻克多角色一致性难题

材料分析与总结

概述

BioNum Technologies 在 Vidu 上线100天之际，自豪地宣布发布 Vidu 1.5 版本，该版本在理解和处理多样化输入以及克服“一致性”挑战方面取得了突破性进展。Vidu 1.5 的推出标志着视觉模型进入了一个新的“上下文”时代，并加速了人工智能（AI）通向通用人工智能（AGI）的步伐。

主要功能与技术进步

面部特征锁定：自全球发布以来，Vidu 就具备通过锁定面部特征生成一致角色的能力。这解决了视频生成中的一个关键痛点。
主体一致性：9月份，Vidu 全球首发“主体一致性”功能，将面部一致性扩展到全身一致性，并且适用范围包括动物、物体和虚拟角色等。

技术突破

复杂主题的精准控制：可以对复杂的主题进行精确控制。
自然一致性的面部特征与动态表情：面部特征和动态表达的一致性得到了显著提升。
多主体一致性：实现多个主体之间的生成一致性。

新版特性及影响

智能涌现：Vidu 1.5 在视觉模型中展示了“智能涌现”，具备强大的上下文学习能力。这表明，除了理解与想象之外，这些视觉模型还能在生成过程中管理记忆。
高效生成速度：继续保持行业领先的生成效率，在30秒内生成视频。

哲学与理念

Vidu 遵循“普遍性”哲学，统一所有问题为可视输入和输出问题。使用单一 Transformer 模型处理变长的输入和输出，并通过视频数据压缩获取智能。

商业应用及未来展望

灵活性与多样性：Vidu 1.5 不仅提升了视频模型的控制能力，还实现了多角度、多个主体及多种元素的一致生成。这标志着视觉智能的出现，加速了 AGI 的到来。
从高质量高效视频生成到上下文信息整合：Vidu 已经不再只是高效率和高质量的视频生成器，而是能够在生成过程中整合上下文信息与记忆的重要工具，这是在视觉模态智能上的重要飞跃。

结论

Vidu 1.5 的发布标志着视觉模型进入了一个新的“上下文”时代。通过其强大的技术突破和高效的性能，它不仅提升了视频模型的控制能力，还加速了人工智能通向通用人工智能（AGI）的步伐。

经验链接与版权信息

体验 URL：www.vidu.studio

希望这些信息能为总经理的决策提供帮助。

Source:https://www.aibase.com/news/13199

近期新闻

AI-NEWS · 2024年 11月 18日

材料分析与总结

概述

主要功能与技术进步

技术突破

新版特性及影响

哲学与理念

商业应用及未来展望

结论

经验链接与版权信息

您可能还喜欢...

AI-NEWS · 2024年 11月 18日

材料分析与总结

概述

主要功能与技术进步

技术突破

新版特性及影响

哲学与理念

商业应用及未来展望

结论

经验链接与版权信息

您可能还喜欢...

MidJourney将开放企业API

OceanBase发布AI数据库

为什么未来属于通才[译]