AI-NEWS · 2025年 11月 28日

阿里Z图碾压大模型

阿里巴巴Z-Image图像生成模型：6B参数实现20B模型性能

核心突破

参数规模：仅6B参数，性能媲美20B闭源旗舰模型
硬件需求：消费级GPU即可运行（如RTX 3060 6G），VRAM上限16GB
生成速度：在RTX 4090上，1024×1024霓虹汉服图像仅需2.3秒完成渲染

技术特点

生成质量

仅需8次采样步骤即可输出印刷级质量图像
在Elo人类偏好排行榜中位列开源模型前列
支持在线特征：皮肤毛孔、玻璃反射、雨雾背光、电影级景深

语言理解

能够一次性理解长嵌套中文提示词
自动纠正不合理描述（如"夜晚的阳光"）
中英文字符显示清晰，不再出现乱码

架构创新

采用新型S3-DiT架构：

文本、视觉语义和图像标记连接为单一流
参数数量降至竞争对手的三分之一
最大化推理效率

生态支持

配套工具：同步发布Z-Image-Edit，支持自然语言"换头换场景"
平台支持：已在ModelScope和Hugging Face上线
技术集成：pull请求已合并至diffusers主分支，支持pip一键安装

行业影响

Z-Image的出现标志着图像生成领域正式进入"轻量高质量"时代：

计算民主化不再只是口号
对企业级API定价构成压力
Midjourney和Flux等厂商可能需要提前考虑降价策略

其他相关AI新闻摘要

模型发布

FLUX.2开源（11月26日）
- Black Forest Labs发布32B开源版本
- 支持10图参考实现95%图像一致性
- 4MP编辑能力，含局部重绘和背景替换
xLLM推理引擎（12月6日发布）
- 支持MoE、文生图、文生视频全场景
- P99延迟低于20ms
- 相比vLLM延迟降低42%，吞吐提升2.1倍

企业动态

惠普裁员（11月27日）
- 计划2028年前裁员4,000-6,000人
- 年化节省目标10亿美元
- 重点转向AI工具采用提升效率
新加坡AI战略（11月26日）
- 从Meta Llama转向阿里巴巴Qwen3-32B
- Qwen-Sea-Lion-v4登顶Sea-Helm开源排行榜
- 在东南亚语言表现优异

技术预测

Grok 5：马斯克预测有10%概率实现AGI
参数规模6万亿，采用MoE架构
训练数据包含X平台5亿日帖和2亿视频时长

火龙果频道

您可能还喜欢...