ai-training

#ai-training

@LinusEkenstam：我从来不喜欢 .md。自去年以来，我在构建大多数上下文时一直使用 HTML。我的论点一直是，如果它是在整个互联网上训练的，那么 HTML 肯定比 .md 多吧？…

X AI KOLs Following ↗ · 2天前缓存

Linus Ekenstam 解释了他在为 AI 构建上下文时偏好使用 HTML 而非 Markdown 的原因，他指出 HTML 的训练数据可用性更广泛。

0 人收藏 0 人点赞

#ai-training

蒸馏有多难？

Reddit r/LocalLLaMA ↗ · 2天前

该文章探讨了模型蒸馏的难度和成本，以DeepSeek R1蒸馏到Llama 3 8b和Qwen 2.5 7b为例，询问为何蒸馏模型不常见。

0 人收藏 0 人点赞

#ai-training

强化学习数据的良好质量控制（18分钟阅读）

TLDR AI ↗ · 3天前缓存

本文讨论了强化学习数据质量控制的重要性，概述了当前数据供应商的不足之处以及前沿AI实验室用于评估RL数据的标准。

0 人收藏 0 人点赞

#ai-training

AMD推出Instinct MI350P加速器：CDNA 4架构登陆PCIe卡

Reddit r/LocalLLaMA ↗ · 3天前

AMD推出采用CDNA 4架构的Instinct MI350P加速器，采用PCIe形态，但尚未公布定价和上市信息。

0 人收藏 0 人点赞

#ai-training

利用 MRC（多路径可靠连接）解锁大规模 AI 训练网络

OpenAI Blog ↗ · 5天前缓存

OpenAI 发布了 MRC（Multipath Reliable Connection），这是一种与行业合作伙伴共同开发的全新网络协议，旨在提升大规模 AI 训练集群的性能和可靠性。该规范通过 Open Compute Project 发布，以标准化基础设施，实现高效的超级计算机运行。

0 人收藏 0 人点赞

#ai-training

旧金山贵到连医生都在做AI副业

Reddit r/artificial ↗ · 2026-04-22 缓存

旧金山高昂的生活成本迫使高收入医生也接起Mercor和Handshake等平台的AI辅导兼职。

0 人收藏 0 人点赞

#ai-training

Meta强制员工电脑安装AI训练软件，引发内部强烈抗议

Hacker News Top ↗ · 2026-04-22 缓存

Meta要求美国员工在工作笔记本上安装记录键盘与鼠标操作的AI训练软件，尽管公司声称有保护措施，仍因隐私问题激起内部强烈反弹。

0 人收藏 0 人点赞

#ai-training

讽刺：Meta员工对在工作电脑上运行监控软件感到不满

Hacker News Top ↗ · 2026-04-22 缓存

Meta正在员工电脑上安装记录键盘、鼠标和截图的监控软件，以收集真实使用数据来构建AI智能体，引发内部不安。

0 人收藏 0 人点赞

#ai-training

Meta采集员工鼠标与键盘动作，用于AI训练数据

Hacker News Top ↗ · 2026-04-21 缓存

Meta正在美国员工的PC上部署内部追踪软件，记录鼠标/键盘操作并偶尔截取屏幕快照，以改进可自动化办公任务的AI代理。

0 人收藏 0 人点赞

#ai-training

Atlassian 默认开启数据收集以训练 AI

Hacker News Top ↗ · 2026-04-20 缓存

Atlassian 已默认启用数据收集功能，将客户数据用于训练 AI 模型，引发企业用户对隐私问题的担忧。

0 人收藏 0 人点赞

#ai-training

@Teknium：有趣的洞见，尤其是这句：Hermes 刚起步时和任何智能体一样低效，常常不知道该如何完成训练时没先验的任务……

X AI KOLs Following ↗ · 2026-04-19 缓存

Teknium 观察到，Hermes 智能体最初表现低效，但一旦成功解决某个任务，效率就会大幅提升，他将其比作“线性化 RL”。

0 人收藏 0 人点赞

#ai-training

澳大利亚联邦银行大规模建设AI素养

OpenAI Blog ↗ · 2025-12-09 缓存

澳大利亚联邦银行正在向近50,000名员工推出ChatGPT Enterprise，以在整个组织内培养AI素养，并通过改进的工作流程和智能体驱动的用例来改善客户成果。

0 人收藏 0 人点赞

#ai-training

OpenAI Residency

OpenAI Blog ↗ · 2021-11-30 缓存

OpenAI 宣布推出新的 Residency 项目，为转向 AI 领域的研究人员和工程师提供为期六个月的全职员工路径，参与者作为薪酬员工获得补偿，并为多样化、非常规背景的人才提供支持。

0 人收藏 0 人点赞

#ai-training

# AI 训练如何实现扩展来源：[https://openai.com/index/how-ai-training-scales/](https://openai.com/index/how-ai-training-scales/) 我们发现梯度噪声尺度（一个简单的统计指标）可以预测神经网络在广泛任务上的训练可并行性。由于复杂任务往往具有更高的梯度噪声，越来越大的批大小在未来可能会变得有用，从而消除了 AI 系统进一步增长的一个潜在瓶颈。更广泛地说，这些结果表明神经网络训练无需被视为神秘的艺术，而可以被严格化和系统化。

0 人收藏 0 人点赞

#ai-training

OpenAI Five 基准测试：结果

OpenAI Blog ↗ · 2018-08-06 缓存

OpenAI 发布了其 Dota 2 游戏系统 OpenAI Five 的基准测试结果，详细介绍了六个主要版本的训练方法，计算需求从 8 到 35 petaflop/s-days 不等，并推出了新的网络架构工具。

0 人收藏 0 人点赞

#ai-training

OpenAI Scholars

OpenAI Blog ↗ · 2018-03-06 缓存

OpenAI Scholars 是一个为科学和工程领域代表性不足的群体提供的导师指导和资助项目，帮助他们在三个月内学习深度学习。申请现已开放，滚动审核从 2018 年 3 月 14 日开始，3 月 31 日截止。

0 人收藏 0 人点赞

#ai-training

Why AI needs a new kind of supercomputer network — the OpenAI Podcast Ep. 18

YouTube AI Channels ↗ · 3天前缓存

OpenAI在播客中讨论了AI训练需要新型超算网络的原因，并介绍了多路径可靠连接（MP-RC）协议以解决同步工作负载的尾部延迟问题。

0 人收藏 0 人点赞

ai-training

提交意见反馈