model-training

#model-training

@googledevs: 通过数据集蒸馏教授模型可重复行为。在干净、结构化的示例上训练较小的模型，以稳定解析器输出…

X AI KOLs Following ↗ · 3小时前缓存

Google Devs 讨论了使用数据集蒸馏在干净、结构化的示例上训练较小模型，以稳定解析器输出并教授模型可重复行为。

0 人收藏 0 人点赞

#model-training

@cursor_ai：在我们的Compile主题演讲中公布的三项公告，包括我们如何与SpaceX合作训练新模型。

X AI KOLs Following ↗ · 昨天缓存

Cursor AI在其Compile主题演讲中宣布了三项更新，包括与SpaceX合作训练新模型。

0 人收藏 0 人点赞

#model-training

@LottoLabs: 如果你一直在考虑训练模型，或者有这个想法但不知从何入手，这是最好的推荐之一…

X AI KOLs Following ↗ · 2天前缓存

一条推文推荐了Hugging Face上的'The Smol Training Playbook'，这是一本为初学者揭秘模型训练的资源。

0 人收藏 0 人点赞

#model-training

@TheTuringPost: https://x.com/TheTuringPost/status/2068474648925216861

X AI KOLs Timeline ↗ · 3天前缓存

一篇关于知识蒸馏的教育性概述，涵盖其历史、核心概念（如softmax和温度）、类型、缩放定律以及包括DeepSeek-R1在内的实际示例。

0 人收藏 0 人点赞

#model-training

@JongwonPar9958: GLM-5.2 有一个巧妙的反奖励作弊技巧。他们不惩罚模型，而是检测可疑的工具调用，阻止…

X AI KOLs Timeline ↗ · 5天前缓存

GLM-5.2 使用一种技术来对抗奖励作弊，即通过检测并阻止可疑的工具调用，而不是惩罚模型，从而避免其他方法中常见的混淆问题。

0 人收藏 0 人点赞

#model-training

@servasyy_ai: Cursor 刚刚举办了他们的首次大会。他们发布了： - 从零训练的 1.5T 参数模型 - GitHub 的直接替代品 Origin - iOS 应用没人预料到这一幕

X AI KOLs Timeline ↗ · 6天前缓存

在Cursor首次大会上，他们发布了从零训练的1.5T参数模型、GitHub直接替代品Origin以及iOS应用，这些发布超出市场预期。

0 人收藏 0 人点赞

#model-training

@mervenoyann：这条管线的第二天发现 > 它有效，在道路标志检测中针对人工标注得到了 map@50=0.8028，使用了……

X AI KOLs Timeline ↗ · 2026-06-17 缓存

Merve (@mervenoyann) 分享了使用多个小型 VLM 作为评判器的管线的第二天发现，在道路标志检测中仅用 1.3k 样本就达到了 map@50=0.8028。这条推文比较了模型拒绝率，讨论了数据集缩小、超具体提示以及泛化该库的计划。

0 人收藏 0 人点赞

#model-training

进来参与：社区模型构建讨论帖

Reddit r/LocalLLaMA ↗ · 2026-06-16

一个帖子提出了一种通过众包计算创建社区AI模型的方法，利用Branch-Train-Stitch技术将独立训练的子模型组装成混合专家（MoE）模型，并讨论了硬件要求、参与者参与方式和技术挑战。

0 人收藏 0 人点赞

#model-training

@liumengxinfly: 看到 Redis 的作者 X 上发声，说总有人反复说中国的模型是蒸馏出来的，是根本不懂机器学习。之前看到有人说中国的模型是蒸馏出来的我还都会辩驳一番，后来实在是见到太多了，累了不想说了，干脆写出来算了。很多人说蒸馏其实根本不知道蒸馏是…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

本文详细解释了机器学习中知识蒸馏的技术原理，指出仅靠收集ChatGPT/Claude的输出对话无法实现有效蒸馏，因为缺少概率分布信息，并讨论了SFT和预训练中使用生成数据的局限性。

0 人收藏 0 人点赞

#model-training

@qinzytech: https://x.com/qinzytech/status/2066585405479371092

X AI KOLs Timeline ↗ · 2026-06-15 缓存

对构建自我进化AI代理的两种方法的技术分析：基于模型的方法（通过像SSMs或具有快速权重更新的transformer等架构，以及训练方法）和基于工具的方法（通过内存或能够自我重写的元工具）。作者为不同受众提供了实用建议。

0 人收藏 0 人点赞

#model-training

观察：每个模型的最佳代理框架将由模型开发者自身提供

Reddit r/AI_Agents ↗ · 2026-06-01

讨论人工智能模型如何在使用其自身开发者构建的框架时表现最佳，而第三方框架可能导致表现不佳，尽管基准测试成绩出色。文中引用了Claude Code（针对Claude模型）和Codex（针对GPT模型）等示例。

0 人收藏 0 人点赞

#model-training

100万亿+的预训练数据？？？这是我见过模型训练中最大的数据量。

Reddit r/LocalLLaMA ↗ · 2026-06-01

一个新的人工智能模型正在使用超过100万亿个令牌进行训练，是其他模型如Kimi、Mimo和DeepSeek通常使用的27-50万亿令牌预训练数据规模的两倍。

0 人收藏 0 人点赞

#model-training

@TheNoise2Signal: 前沿训练如何用到2048块GPU？因为可以从五个维度拆分工作——在大规模训练中……

X AI KOLs Timeline ↗ · 2026-05-25 缓存

解释了前沿AI训练如何通过五个维度分配工作来使用多达2048块GPU，揭开了模型训练框架的神秘面纱。

0 人收藏 0 人点赞

#model-training

@BohuTANG: 在研发 Evot 过程中发现，要让 Anthropic（Opus 系列）模型发挥到极致，官方 Claude Code 的做法基本是最优解，很难绕过。对 Claude Code prompt 做了深度分析和量化验证，发现他们在训练阶段就把…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

在研发Evot过程中发现，要让Anthropic Opus模型发挥极致，官方Claude Code的方法是最优解，因为训练时将Agent Harness行为模式编入了权重，而非纯prompt工程；未来Agent Harness竞争将把行为下沉到模型层。

0 人收藏 0 人点赞

#model-training

Cursor 推出 Composer 2.5

Hacker News Top ↗ · 2026-05-18 缓存

Cursor 发布了 Composer 2.5，这是其 AI 编程助手的重大更新，通过定向强化学习和增加计算资源，提升了智能、行为表现和训练效果，该版本基于 Moonshot 的 Kimi K2.5 构建。

0 人收藏 0 人点赞

#model-training

@AnjneyMidha: 非常酷，通过让模型在早期阶段比严格训练方式更灵活地学习，实现了2-3倍的训练加速…

X AI KOLs Following ↗ · 2026-05-14 缓存

一种新的训练方法通过允许模型在早期阶段更灵活地学习，实现了2-3倍的加速，类似于在家教育相对于工厂式教育的优势。

0 人收藏 0 人点赞

#model-training

@aiDotEngineer: 您的智能体现在可以训练模型。来自@mervenoyann 的观点：开源模型已经迎头赶上。GLM 5.1 在人工智能分析指数上领先……

X AI KOLs Following ↗ · 2026-05-13 缓存

@mervenoyann 的演讲展示了开源模型（如 GLM 5.1）已赶上闭源模型，并说明了 Hugging Face 生态系统如何让智能体训练模型、执行推理和构建工作流。

0 人收藏 0 人点赞

#model-training

@WilliamBarrHeld: 要训练更好的开源模型，我们需要可预测的缩放。Delphi 是 Marin 迈出的第一步：我们预训练了许多小模型……

X AI KOLs Following ↗ · 2026-05-11 缓存

由 William Barr Held 领导的 Marin AI 研究团队推出了 Delphi，这是一种通过预训练小模型来准确预测更大规模 25B 参数训练结果的方法论。该研究旨在建立可预测的缩放规律，以实现更高效的人工智能开源模型开发。

0 人收藏 0 人点赞

#model-training

@akseljoonas：ml-intern 上线 3 周，消息交互量刚刚突破 100 万。这相当于在 21 天内完成了 3.3 个 agent-year 的 ML 研究…

X AI KOLs Following ↗ · 2026-05-11 缓存

ml-intern 在 3 周内处理了超过 100 万条消息，加速了 ML 研究进程。用户项目涵盖模型训练、架构复现以及自动化任务等。

1 人收藏 1 人点赞

#model-training

@FireworksAI_HQ: 前沿实验室押注 AGI 模型会足够强大，以至于你永远不会想对其进行定制。我们持不同观点。正在构建……

X AI KOLs Following ↗ · 2026-05-09 缓存

Fireworks AI 宣布其训练平台进入预览阶段，允许开发者训练、微调并部署自定义 AI 模型，同时完全拥有数据和模型权重。

0 人收藏 0 人点赞

model-training

提交意见反馈