@maximelabonne: 有趣的惊喜:DeepSeek 使用了我的 open-perfectblend 数据集来训练他们的新 DSpark drafter 是时候再次推广它了!它…

X AI KOLs Following 工具

摘要

DeepSeek 使用了 open-perfectblend 数据集来训练他们的新 DSpark drafter;该数据集是《The Perfect Blend》论文的开源复现,提供了超过100万个数学、聊天和代码方面的多样化提示。

有趣的惊喜:DeepSeek 使用了我的 open-perfectblend 数据集来训练他们的新 DSpark drafter 是时候再次推广它了!它是《The Perfect Blend》论文的开源复现。 如果你需要超过100万个数学、聊天和代码方面的多样化提示,它就能胜任。https://t.co/eWrwoGCqSI
查看原文
查看缓存全文

缓存时间: 2026/06/27 15:58

有趣的惊喜:DeepSeek 用我的 open-perfectblend 数据集训练了他们的新 DSpark 草稿模型

是时候再次推广它了!这是对《The Perfect Blend》论文的开源复现。

如果你需要超过100万个涵盖数学、对话和代码的多样化提示,它就能胜任。https://t.co/eWrwoGCqSI

相似文章

deepseek-ai/DeepSeek-V4-Flash-DSpark

Hugging Face Models Trending

DeepSeek releases V4 series of Mixture-of-Experts language models (Pro 1.6T/49B activated, Flash 284B/13B activated) supporting one-million-token context with hybrid attention and speculative decoding, claiming best open-source model performance.

deepseek-ai/DeepSeek-V4-Pro-DSpark

Hugging Face Models Trending

DeepSeek 发布了其 V4 系列的预览版本,包括 DeepSeek-V4-Pro(1.6T 参数,49B 激活)和 DeepSeek-V4-Flash(284B 参数,13B 激活),两者均支持百万 Token 上下文,并采用混合注意力、流形约束超连接和 Muon 优化器。