training

#training

MinT：用于训练和服务数百万LLM的托管基础设施

Hugging Face Daily Papers ↗ · 2026-05-13 缓存

MinT 是一种托管基础设施系统，通过保持基础模型常驻并移动轻量级 LoRA 适配器，实现数百万个 LLM 的高效训练和服务，可跨模型架构、存储和策略管理进行扩展。

0 人收藏 0 人点赞

#training

@eglyman：我们训练了一个0.35B参数的模型，在电子表格导航方面比opus 4.6更优秀。普通企业信用卡公司的常规操作。

X AI KOLs Following ↗ · 2026-05-07 缓存

一位开发者训练了一个350M参数的模型，其处理电子表格的能力优于Anthropic的Opus 4.6。

0 人收藏 0 人点赞

#training

2026年中ROCm状态 [D]

Reddit r/MachineLearning ↗ · 2026-05-07

作者询问2026年中AMD的ROCm生态系统在AI训练领域的当前可行性，将其与NVIDIA的CUDA进行比较，并询问它是否已达到PyTorch的“开箱即用”阶段。

0 人收藏 0 人点赞

#training

ChatGPT如何在保护隐私的同时了解世界

OpenAI Blog ↗ · 2026-05-06 缓存

OpenAI解释了ChatGPT如何从公共数据和用户互动中学习，同时通过过滤和用户控制来保护隐私。

0 人收藏 0 人点赞

#training

Transition

Product Hunt ↗ · 2026-05-05

Transition 是一个由人工智能驱动的教练平台，旨在优化跑步者的运动训练计划并提升比赛表现。

0 人收藏 0 人点赞

#training

第八代TPU：面向智能体时代的双芯片设计

Hacker News Top ↗ · 2026-04-22 缓存

Google发布第八代TPU：TPU 8t用于训练，TPU 8i用于推理，专为大规模、高能效AI智能体工作负载打造，将于今年晚些时候推出。

0 人收藏 0 人点赞

#training

如何获得一个好的目标检测模型？[P]

Reddit r/MachineLearning ↗ · 2026-04-20

一位用户希望获得关于改进其YOLO11n目标检测模型的建议，计划将其部署在Raspberry Pi 5上，但困扰于理论mAP50指标与实际检测性能之间的差距。

0 人收藏 0 人点赞

#training

kaizen

Product Hunt ↗ · 2026-04-16

Kaizen 是一款训练平台，能够根据用户的运动表现与活动数据动态调整跑步训练计划。

0 人收藏 0 人点赞

#training

Ulysses 序列并行：百万Token上下文训练

Hugging Face Blog ↗ · 2026-03-09 缓存

Ulysses 序列并行是一种用于训练具有百万Token上下文的大语言模型的技术，通过将序列块分布在多个GPU上来降低内存需求，实现高效的长上下文训练。它与HuggingFace Accelerate、Transformers Trainer和TRL集成，支持Flash Attention和DeepSpeed ZeRO。

0 人收藏 0 人点赞

#training

# 为新闻机构推出 OpenAI 学院来源：[https://openai.com/index/openai-academy-for-news-organizations/](https://openai.com/index/openai-academy-for-news-organizations/) OpenAI 与美国新闻项目（American Journalism Project）和伦费斯特研究所（The Lenfest Institute）合作，为使用 AI 的记者和出版商推出一个新的学习中心。在 OpenAI，我们认为新闻业对于健康的民主至关重要。人们依靠可靠的地方和国家报道来了解他们的社区和

0 人收藏 0 人点赞

#training

Training Agents: Live tutorial on how to fine-tune a coding agent for continual learning

YouTube AI Channels ↗ · 昨天缓存

本直播教程展示了如何使用监督微调（SFT）在代理跟踪记录数据集上训练一个小型代码代理（Gemma 4 2B），并利用HF Jobs和Track IO自动化参数扫描与评估，体现“用代理训练代理”的理念。

0 人收藏 0 人点赞

#training

Training to cycle across Antarctica | with ChatGPT

YouTube AI Channels ↗ · 2026-06-12 缓存

一位探险者借助ChatGPT作为虚拟助理，计划独自无补给骑行到南极点，并通过减重、故障排查和配重训练来完善准备。

0 人收藏 0 人点赞

#training

FareedKhan-dev/train-llm-from-scratch

GitHub Trending (daily) ↗ · 2026-05-30 缓存

一个GitHub仓库，提供使用PyTorch从头训练大型语言模型的代码，基于Attention Is All You You论文，支持在单个GPU上训练十亿参数模型。

0 人收藏 0 人点赞

#training

2026年5月8日对齐教学：教导Claude为什么

Anthropic Research ↗ · 2026-05-08 缓存

Anthropic分享了改进Claude对齐训练的经验，通过教授底层原则而非仅仅展示示例，在代理错位评估中获得了满分。

0 人收藏 0 人点赞

training

MinT：用于训练和服务数百万LLM的托管基础设施

@eglyman：我们训练了一个0.35B参数的模型，在电子表格导航方面比opus 4.6更优秀。普通企业信用卡公司的常规操作。

2026年中ROCm状态 [D]

ChatGPT如何在保护隐私的同时了解世界

Transition

第八代TPU：面向智能体时代的双芯片设计

如何获得一个好的目标检测模型？[P]

kaizen

Ulysses 序列并行：百万Token上下文训练

OpenAI 为新闻机构推出学院

Training Agents: Live tutorial on how to fine-tune a coding agent for continual learning

Training to cycle across Antarctica | with ChatGPT

FareedKhan-dev/train-llm-from-scratch

2026年5月8日对齐教学：教导Claude为什么

提交意见反馈