AI-NEWS · 2025年 2月 28日

首款商用扩散大模型

Mercury系列扩散大语言模型技术突破分析

核心技术创新

架构革新
- 采用扩散模型（dLLMs）颠覆传统自回归模型（逐token生成）
- 通过「粗粒度到细粒度」生成机制，迭代执行噪声消除优化输出
- 支持多token并行处理，突破传统模型的顺序生成限制
性能优势
- 推理速度提升达10倍（相较传统LLMs），NVIDIA H100 GPU实测**>1000token/s**
- 硬件适配性提升：在智能手机/笔记本等低资源设备实现流畅运行
- 推理成本优化：能耗降低与计算效率提升显著

代码生成领域突破

Mercury Coder公测表现：
- 编程基准测试超越GPT-4o Mini/Claude3.5Haiku等主流优化模型
- Copilot Arena测试：综合性能Top级，用户反馈代码补全准确率行业领先
- 推理速度保持同时（Fastest Model五星评价）

行业影响与未来布局

应用场景扩展
- 即将推出支持智能体应用的对话模型：
  - 强化复杂任务规划能力
  - 延长文本连贯生成长度
  - 数字孪生与多模态融合研发中
技术发展预测
- 扩散模型在结构化输出的文本生成领域展现替代传统LLM的可能性
- 实时AI交互生态或将迎来重构（医疗/教育/工业领域实时反馈场景受益）

数据来源：Inception Labs官方技术白皮书（AIbase Base 2024版权所有）

火龙果频道

您可能还喜欢...