AI-NEWS · 2025年 11月 28日

阿里开源Z-Image模型

阿里巴巴开源Z-Image图像模型：支持中英双语文本渲染！

模型概览

阿里巴巴通义实验室于2025年11月27日开源新一代图像生成模型Z-Image。该模型仅需60亿参数即实现高效图像生成与编辑，其视觉质量达到约200亿参数国际领先商业模型的3倍水平。

核心技术特点

轻量化架构与高性能表现

架构设计：采用单流DiT（Diffusion Transformer）架构
三大变体：
- Z-Image-Turbo：专注快速推理
- Z-Image-Base：基础开发版本
- Z-Image-Edit：图像编辑专用
性能突破：
- 仅需8次采样步骤即可输出高清逼真图像
- VRAM使用量控制在16GB以下
- 可在NVIDIA RTX 30系列消费级GPU流畅运行
- H800 GPU上实现亚秒级生成速度

先进指令理解与双语渲染

提示增强能力：超越表层文本描述，融入"世界知识"实现语义对齐
生成质量：确保自然光照和丰富细节
双语文本渲染：在中英文文本渲染中展现高精度，有效解决传统AI图像模型文本处理痛点
测试表现：
- 在人像生成、场景构图和编辑一致性方面表现优异
- 在ComfyUI框架测试中超越部分SDXL基线模型
- 中文海报渲染和NSFW内容处理展现出色稳定性

行业影响与开源策略

竞争优势分析

参数效率：60亿参数模型性能媲美200亿参数闭源模型
具体性能数据：
- RTX 4090上2.3秒渲染1024×1024图像
- VRAM使用量13GB
- 兼容RTX 3060等消费级GPU，最大VRAM需求16GB

开源生态建设

许可证：Apache 2.0开源协议
发布平台：GitHub、Hugging Face、ModelScope全面可用
行业影响：大幅降低开发者和创意工作者的微调门槛

发展趋势预测

分析师认为，随着此类高效模型的迭代，AI图像工具有望在2026年前加速向移动设备和边缘设备渗透，推动AI图像生成工具向更易用的消费级应用转型。

火龙果频道

您可能还喜欢...