Qwen2vl-Flux：阿里的最新图像生成模型

阿里巴巴最近宣布开源了其最新的图像生成模型——Qwen2vl-Flux。该模型不仅具备编辑、合并和混合等多种功能，还能够根据用户输入的图片或文字生成高度相似的新图片。

主要特点

强大的图像转换能力：
- 用户只需提供一张图片而无需文本提示，即可生成多张与原图相似的新图像。
- 例如，上传一张人物照片后，该模型可以生成同一人物从不同角度的多个视角和表情的照片。
基于文字引导的图像混合：
- 当用户输入一张图片和相关文本提示时，Qwen2vl-Flux能够巧妙地将输入的图片与文本内容融合，创造出新的视觉效果。
基于图像引导的图像混合：
- 用户可以结合两张不同的图片创造角色合并或场景过渡的效果。
- 例如，通过将一个角色和不同背景进行合成，模型可以无缝融合两者，产生新的视觉效果。
网格风格转移功能：
- 允许用户对图像有更细致的控制。可以修改图像的具体部分以实现精美的创意设计。
- 比如，在一张展示高科技与自然环境结合的照片中，用户可以添加生物发光技术的效果或森林晨雾效果，创造更加丰富的视觉体验。

项目链接：Qwen2vl-Flux