Stable Diffusion 3.5 中型模型商用免费发布

稳定AI再次突破技术障碍，发布了新的Stable Diffusion 3.5 Medium模型。这款面向大众的AI绘图工具不仅完全免费且可用于商业用途，还实现了高性能和易用性的完美平衡。

架构与参数：
- 基于Multimodal Diffusion Transformer (MMDiT-X) 架构。
- 参数量优化至25亿个，降低了硬件门槛。
- 可在大多数消费级显卡上运行（只需9.9GB的VRAM）。
技术创新：
- 集成了三个预训练文本编码器，并引入了QK归一化技术以提高训练稳定性。
- 前12个Transformer层采用双注意力模块设计，显著提升了图像质量和布局效果以及对复杂提示的理解能力。
训练过程：
- 结合合成数据和精心挑选的公共数据，采用了分阶段提升分辨率的混合训练策略。
- 保证生成图像的质量和多样性，在中型模型中表现出色，尤其是在图像生成效果和处理速度方面具有明显优势。

Stable Diffusion 3.5 Medium模型的发布不仅标志着稳定AI在技术领域的又一次突破，也彰显了其推动AI技术普及化的决心。无论是在艺术创作还是教育开发方面，这款模型都将会把更多用户带入到AI创作的新时代。建议公司考虑如何利用此工具为我们的业务带来新的可能性。

参考资料来源链接：

图像1

近期新闻