@charles_irl: 这是spec火热夏天

X AI KOLs Timeline 工具

摘要

DeepSeek 开源了 DeepSpec,一个用于训练和评估推测解码模型的完整技术栈代码库。

现在是spec火热夏天
查看原文
查看缓存全文

缓存时间: 2026/06/28 08:04

今夏,推测性解码火了

Lisan al Gaib (@scaling01): DeepSeek 又开源了他们训练栈的另一部分。

DeepSpec:用于训练和评估推测性解码模型的完整代码栈

相似文章

DeepSeek 开源推理优化,生成速度提升 60–85% [pdf]

Hacker News Top

DeepSeek 开源了 DeepSpec,这是一个用于训练和评估推测解码草稿模型的全栈代码库,可实现 60-85% 的生成速度提升。它包含数据准备、训练和评估脚本,支持多种草稿模型算法(DSpark、DFlash、Eagle3)。

DeepSpec - deepseek-ai 集合

Reddit r/LocalLLaMA

DeepSeek AI 在 Hugging Face 上发布了 DeepSpec 集合,包含基于 Qwen3 和 Gemma4 的各种尺寸(1B-3B)的推测解码模型(dspark, dflash, eagle3)。