AI-NEWS · 2025年 5月 15日

阿里发布视频AI模型

Wan2.1-VACE AI 视觉与视听创作编辑工具分析报告

核心功能概述

Wan2.1-VACE(Visual and Audio-Visual Creation and Editing)是一款专注于多模态生成与编辑的AI工具,当前版本参数规模为1.3B14B。主要技术模块包括:

  1. 三大核心能力

    • R2V(Reference-to-Video):参考内容生成视频
    • V2V(Video-to-Video):视频到视频的转换
    • MV2V(Masked Video-to-Video):基于遮罩的视频编辑
  2. 关键技术组件

    • VCU(Video Condition Unit):视频条件处理单元
    • 支持mask遮罩编辑功能

产品特性

  • 支持1080p高清视频处理
  • 提供0.5x-2x多级调速功能
  • 具备画中画(PIP)和全屏模式
  • 字幕/画质/播放速度的可定制化设置

生态关联

  • 代码托管于GitHub平台
  • 与BibiGPT、Monica等AI工具存在生态关联
  • 采用X平台(原Twitter)作为主要传播渠道

版本迭代

当前版本号为Wan2.1,显示该产品已至少经历2次重大版本更新,可能包含:

  • 视频生成精度的提升
  • 编辑功能的扩展(如新增mask遮罩功能)
  • 处理效率的优化

数据观察

1.3B14B的参数规模表明:

  • 属于中等规模AI模型(介于1B-10B参数区间)
  • 14B可能指代特定模块参数或训练数据量
  • 在保持轻量化的同时兼顾多模态处理能力

火龙果频道