training-optimization

标签

Cards List
#training-optimization

@iamgrigorev: https://x.com/iamgrigorev/status/2071688181628678468

X AI KOLs Timeline · 3天前 缓存

一份关于设计有效机器学习实验的详细指南,强调从明确的研究问题开始,培养研究品味,并扩展结果。基于作者在Poolside每周运行约100次实验的经验。

0 人收藏 0 人点赞
#training-optimization

Mythos 可以将训练代码的速度提升 52 倍(相比之下,人类在 4-8 小时内只能提升 4 倍)

Reddit r/singularity · 2026-06-04

Anthropic 的 Mythos 系统在优化训练代码方面实现了 52 倍的加速,而人类在同任务上 4-8 小时内只能实现 4 倍加速,但需要注意的是,绝对倍数在很大程度上取决于起始代码的质量。同类比较显示,过去一年中各模型的改进约为 3 倍到 52 倍。

0 人收藏 0 人点赞
#training-optimization

通过自适应张量并行加速同步RLHF训练中的长尾生成

arXiv cs.AI · 2026-05-26 缓存

本文提出PAT,一种自适应张量并行方法,在同步RLHF训练的生成长阶段动态重构TP配置,以缓解长尾生成瓶颈。在LLaMA3.1-8B和Qwen3-14B上的评估显示,生成延迟最多降低34.6%,端到端迭代延迟最多降低27.2%。

0 人收藏 0 人点赞
#training-optimization

提示缓存,但用于 RL 训练——在长提示/短回复负载上实现 7.5 倍加速

Reddit r/LocalLLaMA · 2026-05-11

一种面向开源 RL 训练引擎的全新优化技术在训练过程中引入了提示缓存,通过减少冗余计算,在长提示、短回复负载场景下实现了高达 7.5 倍的加速。

0 人收藏 0 人点赞
#training-optimization

PRX Part 3 — 在24小时内训练文本到图像模型!

Hugging Face Blog · 2026-03-03 缓存

Photoroom的 PRX Part 3 演示了如何通过结合优化的架构和训练技术(包括感知损失、TREAD 令牌路由和 Muon 优化器)在24小时内训练文本到图像模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈