AI-NEWS · 2024年 10月 30日

Stable Diffusion 3.5 中型模型商用免费发布

稳定AI发布新版Stable Diffusion 3.5 Medium模型

稳定AI再次突破技术障碍,发布了新的Stable Diffusion 3.5 Medium模型。这款面向大众的AI绘图工具不仅完全免费且可用于商业用途,还实现了高性能和易用性的完美平衡。

技术亮点

  1. 架构与参数

    • 基于Multimodal Diffusion Transformer (MMDiT-X) 架构。
    • 参数量优化至25亿个,降低了硬件门槛。
    • 可在大多数消费级显卡上运行(只需9.9GB的VRAM)。
  2. 技术创新

    • 集成了三个预训练文本编码器,并引入了QK归一化技术以提高训练稳定性。
    • 前12个Transformer层采用双注意力模块设计,显著提升了图像质量和布局效果以及对复杂提示的理解能力。
  3. 训练过程

    • 结合合成数据和精心挑选的公共数据,采用了分阶段提升分辨率的混合训练策略。
    • 保证生成图像的质量和多样性,在中型模型中表现出色,尤其是在图像生成效果和处理速度方面具有明显优势。

使用注意事项

  1. 过长提示问题:使用过于冗长的提示可能会导致图像边缘出现瑕疵,建议采用跳层引导采样来优化结构完整性。
  2. 训练数据差异:由于训练数据分布的不同,相同提示可能产生不同的创意效果。

对公司决策的影响

商业价值

  • 免费商用优势:此模型完全免费且可用于商业用途,可以为初创企业和个人创作者提供便利的AI创作工具。
  • 硬件要求低:9.9GB VRAM的要求使更多用户能够轻松使用这款强大的工具,推动了AI技术的普及化。

技术影响

  • 图像生成效果提升:通过双注意力模块和QK归一化技术显著提升了模型在图像质量和复杂提示理解上的表现。
  • 训练策略优化:混合训练策略保证了高质量图像的多样性,为用户提供了更丰富的创作可能性。

总结

Stable Diffusion 3.5 Medium模型的发布不仅标志着稳定AI在技术领域的又一次突破,也彰显了其推动AI技术普及化的决心。无论是在艺术创作还是教育开发方面,这款模型都将会把更多用户带入到AI创作的新时代。建议公司考虑如何利用此工具为我们的业务带来新的可能性。


参考资料来源链接:

  • Copyright AIbase Base 2024, 点击查看原文

图像1

Source:https://www.aibase.com/news/12839