ai-training

#ai-training

FrontierSmith: 大规模合成开放式编程问题

Hugging Face Daily Papers ↗ · 2026-05-14 缓存

FrontierSmith 自动从封闭式任务中生成多样化的开放式编程问题，通过增强的智能体交互和训练数据合成，提升 LLM 在基准测试中的编码性能。

0 人收藏 0 人点赞

#ai-training

Adaption 雄心勃勃推出 AutoScientist，一款帮助模型自我训练的 AI 工具（2 分钟阅读）

TLDR AI ↗ · 2026-05-14 缓存

Adaption 推出 AutoScientist，一款自动化微调的 AI 工具，帮助模型快速学习能力，旨在降低前沿 AI 训练的门槛。

0 人收藏 0 人点赞

#ai-training

所以，SpaceX成了新的算力房东，算力成了新的杠杆点，每笔交易最终都关乎谁控制着大规模GPU的控制权

Reddit r/ArtificialInteligence ↗ · 2026-05-13

本文分析了SpaceX如何成为AI公司的主要算力提供商，其交易包括向Anthropic和Cursor提供GPU，以及谷歌通过SpaceX探索轨道数据中心。

0 人收藏 0 人点赞

#ai-training

@oneill_c: https://x.com/oneill_c/status/2054604986269802579

X AI KOLs Timeline ↗ · 2026-05-13 缓存

文章指出，严肃的AI公司正从封装通用模型转向使用专有交互数据训练自己的专业化模型，因为在分布内智能体任务中，专业化现在经常能匹配甚至超越前沿模型，从而推动更好的单位经济效益。

0 人收藏 0 人点赞

#ai-training

@adaption_ai: 介绍 AutoScientist。大多数模型训练在顶尖实验室之外都会失败。AutoScientist 自动执行完整的研究流……

X AI KOLs Timeline ↗ · 2026-05-13 缓存

Adaption AI 推出了 AutoScientist，这是一款能够自动化完整研究循环的工具，旨在让顶尖实验室之外的模型训练变得更加触手可及。

0 人收藏 0 人点赞

#ai-training

@soumithchintala：集群魔术师和 GPU 沟通专家，快来加入我们！我们正在寻找超级计算工程师来构建基础设施……

X AI KOLs Following ↗ · 2026-05-12 缓存

Thinking Machines Lab 正在纽约和旧金山招聘超级计算工程师，以构建用于实时交互模型和大规模训练的基础设施。

0 人收藏 0 人点赞

#ai-training

我在好莱坞工作。以前做电视的人现在都在训练AI

Hacker News Top ↗ · 2026-05-11 缓存

一位好莱坞编剧详细讲述了在2023年罢工潮引发行业动荡的背景下，从电视编剧转向AI训练零工的经历。文章揭示了AI劳动力市场的残酷现实，包括红队测试任务以及零工平台的运作机制。

0 人收藏 0 人点赞

#ai-training

@LinusEkenstam：我从来不喜欢 .md。自去年以来，我在构建大多数上下文时一直使用 HTML。我的论点一直是，如果它是在整个互联网上训练的，那么 HTML 肯定比 .md 多吧？…

X AI KOLs Following ↗ · 2026-05-09 缓存

Linus Ekenstam 解释了他在为 AI 构建上下文时偏好使用 HTML 而非 Markdown 的原因，他指出 HTML 的训练数据可用性更广泛。

0 人收藏 0 人点赞

#ai-training

蒸馏有多难？

Reddit r/LocalLLaMA ↗ · 2026-05-08

该文章探讨了模型蒸馏的难度和成本，以DeepSeek R1蒸馏到Llama 3 8b和Qwen 2.5 7b为例，询问为何蒸馏模型不常见。

0 人收藏 0 人点赞

#ai-training

强化学习数据的良好质量控制（18分钟阅读）

TLDR AI ↗ · 2026-05-08 缓存

本文讨论了强化学习数据质量控制的重要性，概述了当前数据供应商的不足之处以及前沿AI实验室用于评估RL数据的标准。

0 人收藏 0 人点赞

#ai-training

AMD推出Instinct MI350P加速器：CDNA 4架构登陆PCIe卡

Reddit r/LocalLLaMA ↗ · 2026-05-07

AMD推出采用CDNA 4架构的Instinct MI350P加速器，采用PCIe形态，但尚未公布定价和上市信息。

0 人收藏 0 人点赞

#ai-training

Tendem by Toloka

Product Hunt ↗ · 2026-05-06

Tendem by Toloka 是一个连接人工智能开发者与人类专家以进行数据标注和训练的平台。

0 人收藏 0 人点赞

#ai-training

利用 MRC（多路径可靠连接）解锁大规模 AI 训练网络

OpenAI Blog ↗ · 2026-05-05 缓存

OpenAI 发布了 MRC（Multipath Reliable Connection），这是一种与行业合作伙伴共同开发的全新网络协议，旨在提升大规模 AI 训练集群的性能和可靠性。该规范通过 Open Compute Project 发布，以标准化基础设施，实现高效的超级计算机运行。

0 人收藏 0 人点赞

#ai-training

旧金山贵到连医生都在做AI副业

Reddit r/artificial ↗ · 2026-04-22 缓存

旧金山高昂的生活成本迫使高收入医生也接起Mercor和Handshake等平台的AI辅导兼职。

0 人收藏 0 人点赞

#ai-training

Meta强制员工电脑安装AI训练软件，引发内部强烈抗议

Hacker News Top ↗ · 2026-04-22 缓存

Meta要求美国员工在工作笔记本上安装记录键盘与鼠标操作的AI训练软件，尽管公司声称有保护措施，仍因隐私问题激起内部强烈反弹。

0 人收藏 0 人点赞

#ai-training

讽刺：Meta员工对在工作电脑上运行监控软件感到不满

Hacker News Top ↗ · 2026-04-22 缓存

Meta正在员工电脑上安装记录键盘、鼠标和截图的监控软件，以收集真实使用数据来构建AI智能体，引发内部不安。

0 人收藏 0 人点赞

#ai-training

Meta采集员工鼠标与键盘动作，用于AI训练数据

Hacker News Top ↗ · 2026-04-21 缓存

Meta正在美国员工的PC上部署内部追踪软件，记录鼠标/键盘操作并偶尔截取屏幕快照，以改进可自动化办公任务的AI代理。

0 人收藏 0 人点赞

#ai-training

Atlassian 默认开启数据收集以训练 AI

Hacker News Top ↗ · 2026-04-20 缓存

Atlassian 已默认启用数据收集功能，将客户数据用于训练 AI 模型，引发企业用户对隐私问题的担忧。

0 人收藏 0 人点赞

#ai-training

@Teknium：有趣的洞见，尤其是这句：Hermes 刚起步时和任何智能体一样低效，常常不知道该如何完成训练时没先验的任务……

X AI KOLs Following ↗ · 2026-04-19 缓存

Teknium 观察到，Hermes 智能体最初表现低效，但一旦成功解决某个任务，效率就会大幅提升，他将其比作“线性化 RL”。

0 人收藏 0 人点赞

#ai-training

澳大利亚联邦银行大规模建设AI素养

OpenAI Blog ↗ · 2025-12-09 缓存

澳大利亚联邦银行正在向近50,000名员工推出ChatGPT Enterprise，以在整个组织内培养AI素养，并通过改进的工作流程和智能体驱动的用例来改善客户成果。

0 人收藏 0 人点赞

ai-training

提交意见反馈