system-optimization

标签

Cards List
#system-optimization

EMA: 面向学习型系统的高效模型自适应方法

arXiv cs.LG · 4小时前 缓存

本文介绍了EMA,一种面向学习型系统的模型自适应系统,能够在降低训练和标注成本的同时,提升系统在不断演化环境中的性能。

0 人收藏 0 人点赞
#system-optimization

DisagMoE:通过解耦 AF-Pipe 并行实现计算与通信重叠的 MoE 训练

arXiv cs.LG · 2天前 缓存

本文介绍了 DisagMoE,一种 MoE 训练系统,通过将注意力层和前馈网络(FFN)层解耦到不同的 GPU 组来优化计算与通信的重叠。该系统基于 Megatron-LM 实现,通过解决节点间通信瓶颈,在 H800 集群上实现了高达 1.8 倍的加速。

0 人收藏 0 人点赞
#system-optimization

@Suryanshti777: NVIDIA刚刚揭秘了它们用来让LLM微调显著加速的隐藏技巧。不是新GPU。不是大…

X AI KOLs Timeline · 2026-05-07

NVIDIA和Unsloth发布了一篇技术指南,详细介绍了三种底层优化方法,可将LLM微调速度提升高达25%,包括打包序列缓存、双缓冲检查点存储和优化的MoE路由。该指南提供了深入的系统级解释和基准测试,面向机器学习工程师和开发者。

0 人收藏 0 人点赞
#system-optimization

以‘始终免费’方式全天候运行OpenClaw(非Oracle VPS选项?)

Reddit r/openclaw · 2026-05-07

作者寻求Oracle Cloud的替代方案,以在‘始终免费’套餐中托管全天候的OpenClaw实例,讨论了Google Cloud e2-micro和Fly.io等选项,并询问如何在1GB RAM内运行的优化技巧。

0 人收藏 0 人点赞
#system-optimization

TokenSpeed:面向智能体工作负载的"光速"LLM推理引擎(5分钟阅读)

TLDR AI · 2026-05-07 缓存

Lightseek发布TokenSpeed,一款面向智能体工作负载优化的高性能LLM推理引擎,采用编译器驱动的并行技术和先进的内核优化,相关技术已被vLLM采纳。

0 人收藏 0 人点赞
#system-optimization

Greedeks/GTweak

GitHub Trending (daily) · 昨天 缓存

GTweak 是一款开源的 Windows 系统优化和隐私工具,允许用户在激活 Windows 的同时禁用遥测、更新和非必要服务。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈