model-training

标签

Cards List
#model-training

@googledevs: 通过数据集蒸馏教授模型可重复行为。在干净、结构化的示例上训练较小的模型,以稳定解析器输出…

X AI KOLs Following · 3小时前 缓存

Google Devs 讨论了使用数据集蒸馏在干净、结构化的示例上训练较小模型,以稳定解析器输出并教授模型可重复行为。

0 人收藏 0 人点赞
#model-training

@cursor_ai:在我们的Compile主题演讲中公布的三项公告,包括我们如何与SpaceX合作训练新模型。

X AI KOLs Following · 昨天 缓存

Cursor AI在其Compile主题演讲中宣布了三项更新,包括与SpaceX合作训练新模型。

0 人收藏 0 人点赞
#model-training

@LottoLabs: 如果你一直在考虑训练模型,或者有这个想法但不知从何入手,这是最好的推荐之一…

X AI KOLs Following · 2天前 缓存

一条推文推荐了Hugging Face上的'The Smol Training Playbook',这是一本为初学者揭秘模型训练的资源。

0 人收藏 0 人点赞
#model-training

@TheTuringPost: https://x.com/TheTuringPost/status/2068474648925216861

X AI KOLs Timeline · 3天前 缓存

一篇关于知识蒸馏的教育性概述,涵盖其历史、核心概念(如softmax和温度)、类型、缩放定律以及包括DeepSeek-R1在内的实际示例。

0 人收藏 0 人点赞
#model-training

@JongwonPar9958: GLM-5.2 有一个巧妙的反奖励作弊技巧。他们不惩罚模型,而是检测可疑的工具调用,阻止…

X AI KOLs Timeline · 5天前 缓存

GLM-5.2 使用一种技术来对抗奖励作弊,即通过检测并阻止可疑的工具调用,而不是惩罚模型,从而避免其他方法中常见的混淆问题。

0 人收藏 0 人点赞
#model-training

@servasyy_ai: Cursor 刚刚举办了他们的首次大会。 他们发布了: - 从零训练的 1.5T 参数模型 - GitHub 的直接替代品 Origin - iOS 应用 没人预料到这一幕

X AI KOLs Timeline · 6天前 缓存

在Cursor首次大会上,他们发布了从零训练的1.5T参数模型、GitHub直接替代品Origin以及iOS应用,这些发布超出市场预期。

0 人收藏 0 人点赞
#model-training

@mervenoyann:这条管线的第二天发现 > 它有效,在道路标志检测中针对人工标注得到了 map@50=0.8028,使用了……

X AI KOLs Timeline · 2026-06-17 缓存

Merve (@mervenoyann) 分享了使用多个小型 VLM 作为评判器的管线的第二天发现,在道路标志检测中仅用 1.3k 样本就达到了 map@50=0.8028。这条推文比较了模型拒绝率,讨论了数据集缩小、超具体提示以及泛化该库的计划。

0 人收藏 0 人点赞
#model-training

进来参与:社区模型构建讨论帖

Reddit r/LocalLLaMA · 2026-06-16

一个帖子提出了一种通过众包计算创建社区AI模型的方法,利用Branch-Train-Stitch技术将独立训练的子模型组装成混合专家(MoE)模型,并讨论了硬件要求、参与者参与方式和技术挑战。

0 人收藏 0 人点赞
#model-training

@liumengxinfly: 看到 Redis 的作者 X 上发声,说总有人反复说中国的模型是蒸馏出来的,是根本不懂机器学习。 之前看到有人说中国的模型是蒸馏出来的我还都会辩驳一番,后来实在是见到太多了,累了不想说了,干脆写出来算了。 很多人说蒸馏其实根本不知道蒸馏是…

X AI KOLs Timeline · 2026-06-16 缓存

本文详细解释了机器学习中知识蒸馏的技术原理,指出仅靠收集ChatGPT/Claude的输出对话无法实现有效蒸馏,因为缺少概率分布信息,并讨论了SFT和预训练中使用生成数据的局限性。

0 人收藏 0 人点赞
#model-training

@qinzytech: https://x.com/qinzytech/status/2066585405479371092

X AI KOLs Timeline · 2026-06-15 缓存

对构建自我进化AI代理的两种方法的技术分析:基于模型的方法(通过像SSMs或具有快速权重更新的transformer等架构,以及训练方法)和基于工具的方法(通过内存或能够自我重写的元工具)。作者为不同受众提供了实用建议。

0 人收藏 0 人点赞
#model-training

观察:每个模型的最佳代理框架将由模型开发者自身提供

Reddit r/AI_Agents · 2026-06-01

讨论人工智能模型如何在使用其自身开发者构建的框架时表现最佳,而第三方框架可能导致表现不佳,尽管基准测试成绩出色。文中引用了Claude Code(针对Claude模型)和Codex(针对GPT模型)等示例。

0 人收藏 0 人点赞
#model-training

100万亿+的预训练数据???这是我见过模型训练中最大的数据量。

Reddit r/LocalLLaMA · 2026-06-01

一个新的人工智能模型正在使用超过100万亿个令牌进行训练,是其他模型如Kimi、Mimo和DeepSeek通常使用的27-50万亿令牌预训练数据规模的两倍。

0 人收藏 0 人点赞
#model-training

@TheNoise2Signal: 前沿训练如何用到2048块GPU?因为可以从五个维度拆分工作——在大规模训练中……

X AI KOLs Timeline · 2026-05-25 缓存

解释了前沿AI训练如何通过五个维度分配工作来使用多达2048块GPU,揭开了模型训练框架的神秘面纱。

0 人收藏 0 人点赞
#model-training

@BohuTANG: 在研发 Evot 过程中发现,要让 Anthropic(Opus 系列)模型发挥到极致,官方 Claude Code 的做法基本是最优解,很难绕过。 对 Claude Code prompt 做了深度分析和量化验证,发现他们在训练阶段就把…

X AI KOLs Timeline · 2026-05-23 缓存

在研发Evot过程中发现,要让Anthropic Opus模型发挥极致,官方Claude Code的方法是最优解,因为训练时将Agent Harness行为模式编入了权重,而非纯prompt工程;未来Agent Harness竞争将把行为下沉到模型层。

0 人收藏 0 人点赞
#model-training

Cursor 推出 Composer 2.5

Hacker News Top · 2026-05-18 缓存

Cursor 发布了 Composer 2.5,这是其 AI 编程助手的重大更新,通过定向强化学习和增加计算资源,提升了智能、行为表现和训练效果,该版本基于 Moonshot 的 Kimi K2.5 构建。

0 人收藏 0 人点赞
#model-training

@AnjneyMidha: 非常酷,通过让模型在早期阶段比严格训练方式更灵活地学习,实现了2-3倍的训练加速…

X AI KOLs Following · 2026-05-14 缓存

一种新的训练方法通过允许模型在早期阶段更灵活地学习,实现了2-3倍的加速,类似于在家教育相对于工厂式教育的优势。

0 人收藏 0 人点赞
#model-training

@aiDotEngineer: 您的智能体现在可以训练模型。来自@mervenoyann 的观点:开源模型已经迎头赶上。GLM 5.1 在人工智能分析指数上领先……

X AI KOLs Following · 2026-05-13 缓存

@mervenoyann 的演讲展示了开源模型(如 GLM 5.1)已赶上闭源模型,并说明了 Hugging Face 生态系统如何让智能体训练模型、执行推理和构建工作流。

0 人收藏 0 人点赞
#model-training

@WilliamBarrHeld: 要训练更好的开源模型,我们需要可预测的缩放。Delphi 是 Marin 迈出的第一步:我们预训练了许多小模型……

X AI KOLs Following · 2026-05-11 缓存

由 William Barr Held 领导的 Marin AI 研究团队推出了 Delphi,这是一种通过预训练小模型来准确预测更大规模 25B 参数训练结果的方法论。该研究旨在建立可预测的缩放规律,以实现更高效的人工智能开源模型开发。

0 人收藏 0 人点赞
#model-training

@akseljoonas:ml-intern 上线 3 周,消息交互量刚刚突破 100 万。这相当于在 21 天内完成了 3.3 个 agent-year 的 ML 研究…

X AI KOLs Following · 2026-05-11 缓存

ml-intern 在 3 周内处理了超过 100 万条消息,加速了 ML 研究进程。用户项目涵盖模型训练、架构复现以及自动化任务等。

1 人收藏 1 人点赞
#model-training

@FireworksAI_HQ: 前沿实验室押注 AGI 模型会足够强大,以至于你永远不会想对其进行定制。我们持不同观点。正在构建……

X AI KOLs Following · 2026-05-09 缓存

Fireworks AI 宣布其训练平台进入预览阶段,允许开发者训练、微调并部署自定义 AI 模型,同时完全拥有数据和模型权重。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈