AI-NEWS · 2025年 8月 2日

字节跳动发布Seed扩散模型

字节跳动Seed团队发布实验性扩散语言模型Seed Diffusion Preview

技术突破概述

字节跳动Seed团队宣布推出实验性扩散语言模型Seed Diffusion Preview,标志着语言模型领域的一项重大技术突破。该模型旨在通过结构化代码生成实验,验证离散扩散技术路径作为下一代语言模型基础框架的可行性。

核心性能指标

  • 推理速度:2146 tokens/秒
  • 速度提升:比同等规模自回归模型快5.4倍
  • 性能表现:在多项代码生成基准测试中达到与自回归模型相当的水平

技术挑战与创新

主要挑战

扩散模型在图像/视频合成等连续数据领域已取得显著成功,但应用于自然语言等离散领域存在根本性挑战,主要源于标准扩散过程与离散状态空间的不兼容性。

四大关键技术创新

  1. 两阶段课程学习

    • 掩码扩散训练
    • 编辑扩散训练
    • 目标:增强模型的局部上下文补全能力和全局代码合理性评估
  2. 约束顺序扩散

    • 通过引入代码的结构化先验,引导模型理解正确依赖关系
  3. 同策略学习

    • 优化生成步骤数量,提升模型推理速度
  4. 块级并行扩散采样

    • 在保持因果顺序的同时实现高效的块级推理

实验结果

  • 代码推理速度达2146 tokens/秒
  • 在多项行业基准测试中表现与顶级自回归模型相当
  • 在代码编辑等任务中甚至超越自回归模型

技术意义

这一成果不仅展示了离散扩散模型在加速推理方面的潜力,更凸显了其在复杂推理任务中的应用前景。

火龙果频道