字节跳动Seed Diffusion引爆AI代码生成！速度提升5倍，质量不输AR模型？

高效码农

3 月前

代码生成也能像图片扩散一样快？——字节跳动 Seed Diffusion 实测笔记

更新时间：2025 年 8 月 1 日

“

想象一下：你写一句需求，模型在 1 秒内就给出 2000 多行可用的 Python 代码，而且质量不输传统逐字生成的模型。这不是营销口号，而是字节跳动 Seed 团队 7 月 31 日发布的实验模型 Seed Diffusion Preview 在公开基准上跑出的真实成绩。

先把概念说透：

Seed Diffusion Preview 用离散扩散思路，把“擦噪声”这一步拆成两个学习阶段，再加几道工程优化，最终把推理速度推到 2146 tokens/s，比同等规模 AR 模型快 5.4 倍。

扩散模型如果只玩“随机掩码”，会养成坏习惯——它认为没掩码的位置一定正确，结果生成后不肯改。Seed Diffusion 用“课程表”治这个毛病。

实验结果：加入第二阶段后，CanItEdit 修复任务 pass@1 从 50.5 % 提升到 54.3 %，证明“改错”能力确实被喂进去了。

纯扩散允许任意顺序生成，但代码里的变量必须先定义再引用。Seed Diffusion 在后训练阶段加了一道“轨迹蒸馏”：

这样做既保留了并行采样的灵活性，又把人类先验“悄悄”塞了进去。

理论上扩散模型一步就能出结果，实际上步数太少会“翻车”。Seed 团队的做法是：

效果：步数被“剪枝”掉大量低质量路径，速度一路上涨，质量却保持平稳。

算法之外，工程团队把扩散采样拆成块级半自回归流程：

图：不同块大小对延迟的影响

结论：32-token 的块在 H20 GPU 上性价比最高，既吃得下并行收益，又不会让一次前向过大。

官方在 8 个公开基准上跑了完整对比，这里挑大家最关心的三项：

基准	任务特色	Seed Diffusion Preview	同级 AR 模型平均
HumanEval	手写代码补全	79.4 %	~80 %
LiveCodeBench v1-v6	竞赛新题，防数据泄露	72.6 %	73 % 左右
CanItEdit	按指令修 bug	54.3 %	50.5 %

一句话总结：速度翻 5 倍，质量不掉线，修 bug 还更拿手。

目前官方只放出 预览版，可直接在线试玩：

文档提到后续会放出推理代码与权重，预计包括：

问题	简明回答
和 Gemini Diffusion、Mercury Coder 有何不同？	Seed Diffusion 在公开代码基准上速度领先，且明确给出 2146 tokens/s 的硬件环境（H20 GPU）。
能用中文注释生成代码吗？	训练数据来自 Seed-Coder 管道，支持多语言注释，中文自然可以。
模型规模多大？	论文未披露总参数量，但从对比表看与 8B–15B 模型同场竞技，推测在此区间。
会不会生成不安全代码？	目前为实验预览版，暂无完整护栏。生产环境需自行加固。
离散扩散只能做代码吗？	现阶段聚焦代码验证路线，论文指出未来会探索通用语言和复杂推理。
需要特殊硬件吗？	官方演示用 H20 GPU，消费级显卡暂未测试。块级并行理论上对显存更友好。
为什么有时生成结果重复？	早期版本在极短步数下会出现，阶段二的“编辑训练”已显著缓解。
何时开源？	官方仅表示“后续计划”，未给出时间表。

Seed Diffusion Preview 把离散扩散路线从“论文里的潜力股”推到“工程上可落地”的临界点。它告诉我们：

下一步，团队会把这套框架往更大规模、更复杂推理任务上搬。如果你正在做代码助手、低代码平台，甚至只是想让本地 IDE 秒出模板，这条技术路线值得持续关注。