AI-NEWS · 2024年 11月 18日

盛书科技发布Vidu 1.5,攻克多角色一致性难题

材料分析与总结

概述

BioNum Technologies 在 Vidu 上线100天之际,自豪地宣布发布 Vidu 1.5 版本,该版本在理解和处理多样化输入以及克服“一致性”挑战方面取得了突破性进展。Vidu 1.5 的推出标志着视觉模型进入了一个新的“上下文”时代,并加速了人工智能(AI)通向通用人工智能(AGI)的步伐。

主要功能与技术进步

  • 面部特征锁定:自全球发布以来,Vidu 就具备通过锁定面部特征生成一致角色的能力。这解决了视频生成中的一个关键痛点。

  • 主体一致性:9月份,Vidu 全球首发“主体一致性”功能,将面部一致性扩展到全身一致性,并且适用范围包括动物、物体和虚拟角色等。

技术突破

  1. 复杂主题的精准控制:可以对复杂的主题进行精确控制。
  2. 自然一致性的面部特征与动态表情:面部特征和动态表达的一致性得到了显著提升。
  3. 多主体一致性:实现多个主体之间的生成一致性。

新版特性及影响

  • 智能涌现:Vidu 1.5 在视觉模型中展示了“智能涌现”,具备强大的上下文学习能力。这表明,除了理解与想象之外,这些视觉模型还能在生成过程中管理记忆。

  • 高效生成速度:继续保持行业领先的生成效率,在30秒内生成视频。

哲学与理念

  • Vidu 遵循“普遍性”哲学,统一所有问题为可视输入和输出问题。使用单一 Transformer 模型处理变长的输入和输出,并通过视频数据压缩获取智能。

商业应用及未来展望

  • 灵活性与多样性:Vidu 1.5 不仅提升了视频模型的控制能力,还实现了多角度、多个主体及多种元素的一致生成。这标志着视觉智能的出现,加速了 AGI 的到来。

  • 从高质量高效视频生成到上下文信息整合:Vidu 已经不再只是高效率和高质量的视频生成器,而是能够在生成过程中整合上下文信息与记忆的重要工具,这是在视觉模态智能上的重要飞跃。

结论

Vidu 1.5 的发布标志着视觉模型进入了一个新的“上下文”时代。通过其强大的技术突破和高效的性能,它不仅提升了视频模型的控制能力,还加速了人工智能通向通用人工智能(AGI)的步伐。


经验链接与版权信息

  • 体验 URLwww.vidu.studio
  • 版权所有:AIbase Base 2024,点击访问源网站

希望这些信息能为总经理的决策提供帮助。

Source:https://www.aibase.com/news/13199