@charles_irl: 这是spec火热夏天

X AI KOLs Timeline 2026/06/27 15:53 工具

deepseek speculative-decoding open-source training-stack codebase

摘要

DeepSeek 开源了 DeepSpec，一个用于训练和评估推测解码模型的完整技术栈代码库。

现在是spec火热夏天

查看原文

查看缓存全文

缓存时间: 2026/06/28 08:04

今夏，推测性解码火了

Lisan al Gaib (@scaling01)： DeepSeek 又开源了他们训练栈的另一部分。

DeepSpec：用于训练和评估推测性解码模型的完整代码栈

相似文章

Hacker News Top

DeepSeek 开源了 DeepSpec，这是一个用于训练和评估推测解码草稿模型的全栈代码库，可实现 60-85% 的生成速度提升。它包含数据准备、训练和评估脚本，支持多种草稿模型算法（DSpark、DFlash、Eagle3）。

Reddit r/LocalLLaMA

DeepSeek AI 在 Hugging Face 上发布了 DeepSpec 集合，包含基于 Qwen3 和 Gemma4 的各种尺寸（1B-3B）的推测解码模型（dspark, dflash, eagle3）。

X AI KOLs Timeline

DeepSeek发布了DSpark，一种投机解码方法，可将V4 Flash和Pro的吞吐量提升51%至400%，同时还开源了DeepSpec代码库，用于训练和评估草稿模型。

X AI KOLs Following

DeepSeek 发布了一篇论文以及采用MIT许可证的开源实现（DSpark），通过使用小型“猜测”模型和大型“检查”模型，将LLM响应速度提升高达80%，同时兼顾速度与准确率，无需权衡取舍。

X AI KOLs Following

Modal和Z Lab发布了六款新的DFlash推测解码草稿模型，用于Qwen 3.x，在B200上实现了每秒超过1000个token，并认为推测解码是最有影响力的推理优化。