@tom_doerr: 大语言模型指令与推理数据集精选列表 https://github.com/mlabonne/llm-datasets…
摘要
由 mlabonne 整理的大语言模型指令与推理数据集列表,包含数据集特征、许可证及用例详情。
大语言模型指令与推理数据集精选列表
https://t.co/uCY2p6FdRB https://t.co/tX5z2pcnvj
查看缓存全文
缓存时间: 2026/05/15 06:58
X Follow me on X • 🤗 Hugging Face • 💻 博客 • 📙 LLM Engineer’s Handbook
精选的后训练数据集和工具列表。
相似文章
@tom_doerr: 视频引导的ML系统和LLM基础设施课程 https://github.com/HuaizhengZhang/AI-Infra-from-Zero-to-He…
一个精选的视频引导课程和全面的资源列表,用于学习ML系统和LLM基础设施,包括论文、课程和教程。
@tom_doerr: 本地LLM工具和硬件精选列表 https://github.com/0xSojalSec/LLMs-local…
一份精选列表,包含用于本地运行大语言模型的平台、工具、模型、硬件和资源,托管在GitHub上。
@tom_doerr: 无需训练即可提升 LLM 推理准确性 https://github.com/codelion/optillm…
OptiLLM 是一款开源推理代理,采用先进技术无需重新训练即可将 LLM 推理准确性提升高达 10 倍,兼容各种 AI API。
@jiqizhixin:太棒了!关于推理型LLM的强化学习现状 https://aweers.de/blog/2026/rl-for-llms/…
一篇全面回顾推理型LLM强化学习现状的博文,涵盖从REINFORCE、PPO到GRPO乃至更多方法,并与InstructGPT、DeepSeek-R1等关键模型相联系。
@tom_doerr: 从原始数据生成LLM就绪的数据集 https://github.com/OpenDCAI/DataFlow…
DataFlow是一个开源工具,提供可视化、低代码的管道,用于从原始数据生成、清洗和准备高质量的LLM训练数据集。它包含一篇arXiv上的技术报告。