Google Flow集成Nano Banana模型:一键抠图生成视频素材
功能概述
Google今日在其AI视频工具Flow中新增图像编辑模块,深度集成Gemini 2.5 Flash图像模型(代号Nano Banana),支持自然语言一键背景移除、主体分离和场景替换功能。
核心特性
- 一键操作:支持自然语言指令,如"移除背景并添加柔光"或"放置于月球表面"
- 高质量输出:生成PNG透明图像或合成图像,保留发丝级边缘细节
- 视频集成:可直接拖拽至时间线生成8秒动态镜头
- 处理效率:实测30秒内完成"人物+奇幻森林"动态镜头制作
技术参数
- 价格:每张图像0.039美元
- 适用版本:免费版Gemini及以上用户
- 企业服务:同步推出企业级Vertex AI
- 水印保护:默认嵌入SynthID隐形水印
- API计划:下月开放批量接口,针对短视频和电商海报等高产出场景
实际应用效果
在街拍照片处理测试中,Nano Banana模型处理后导入Flow,面部和服装纹理保持一致,证明了其在保持图像质量的同时实现高效视频素材生成的能力。
相关产品动态
Gemini 3.0进展
- 预计2025年底发布
- 在代码生成和多模态推理方面取得重大进展
- 升级Nano图像引擎
Veo 3.1视频模型
- 新增"多图参考"功能
- 支持同时上传三张参考图像,分别提取人物、场景和风格特征
- 生成8秒1080p视频,确保角色跨帧一致性和光照一致性
行业影响
这一集成标志着AI视频创作工具在易用性和专业性方面的显著提升,为内容创作者提供了更高效的素材制作解决方案,特别是在短视频和电商内容创作领域具有重要应用价值。
