Qwen2vl-Flux:阿里的最新图像生成模型
阿里巴巴最近宣布开源了其最新的图像生成模型——Qwen2vl-Flux。该模型不仅具备编辑、合并和混合等多种功能,还能够根据用户输入的图片或文字生成高度相似的新图片。
主要特点
-
强大的图像转换能力:
- 用户只需提供一张图片而无需文本提示,即可生成多张与原图相似的新图像。
- 例如,上传一张人物照片后,该模型可以生成同一人物从不同角度的多个视角和表情的照片。
-
基于文字引导的图像混合:
- 当用户输入一张图片和相关文本提示时,Qwen2vl-Flux能够巧妙地将输入的图片与文本内容融合,创造出新的视觉效果。
-
基于图像引导的图像混合:
- 用户可以结合两张不同的图片创造角色合并或场景过渡的效果。
- 例如,通过将一个角色和不同背景进行合成,模型可以无缝融合两者,产生新的视觉效果。
-
网格风格转移功能:
- 允许用户对图像有更细致的控制。可以修改图像的具体部分以实现精美的创意设计。
- 比如,在一张展示高科技与自然环境结合的照片中,用户可以添加生物发光技术的效果或森林晨雾效果,创造更加丰富的视觉体验。
关键要点
- Qwen2vl-Flux是开源的,并具备强大的图像生成和编辑能力。
- 支持图像转换及基于文本引导的图像混合以创建新的视觉效果。
- 提供基于图像引导的图像混合与网格风格转移功能,允许用户进行精细控制。
项目链接:Qwen2vl-Flux