AI-NEWS · 2025年 11月 18日

谷歌一键抠图生成视频

Google Flow集成Nano Banana模型:一键抠图生成视频素材

功能概述

Google今日在其AI视频工具Flow中新增图像编辑模块,深度集成Gemini 2.5 Flash图像模型(代号Nano Banana),支持自然语言一键背景移除、主体分离和场景替换功能。

核心特性

  • 一键操作:支持自然语言指令,如"移除背景并添加柔光"或"放置于月球表面"
  • 高质量输出:生成PNG透明图像或合成图像,保留发丝级边缘细节
  • 视频集成:可直接拖拽至时间线生成8秒动态镜头
  • 处理效率:实测30秒内完成"人物+奇幻森林"动态镜头制作

技术参数

  • 价格:每张图像0.039美元
  • 适用版本:免费版Gemini及以上用户
  • 企业服务:同步推出企业级Vertex AI
  • 水印保护:默认嵌入SynthID隐形水印
  • API计划:下月开放批量接口,针对短视频和电商海报等高产出场景

实际应用效果

在街拍照片处理测试中,Nano Banana模型处理后导入Flow,面部和服装纹理保持一致,证明了其在保持图像质量的同时实现高效视频素材生成的能力。

相关产品动态

Gemini 3.0进展

  • 预计2025年底发布
  • 在代码生成和多模态推理方面取得重大进展
  • 升级Nano图像引擎

Veo 3.1视频模型

  • 新增"多图参考"功能
  • 支持同时上传三张参考图像,分别提取人物、场景和风格特征
  • 生成8秒1080p视频,确保角色跨帧一致性和光照一致性

行业影响

这一集成标志着AI视频创作工具在易用性和专业性方面的显著提升,为内容创作者提供了更高效的素材制作解决方案,特别是在短视频和电商内容创作领域具有重要应用价值。

火龙果频道