resource-management

#resource-management

@bernhardsson: 一种思考@modal极限的方式是，我们是全球规模的计算聚合器和资源管理者…

X AI KOLs Following ↗ · 2026-07-06

Modal的目标是成为全球计算和资源管理的聚合器，就像一个超大型全球计算机。

0 人收藏 0 人点赞

#resource-management

Hugging Face Daily Papers ↗ · 2026-06-17 缓存

TurboServe 是一个专为流式视频生成工作负载设计的服务系统，采用在线调度方法，协调会话放置和 GPU 资源分配，以降低延迟和成本。

0 人收藏 0 人点赞

#resource-management

arXiv cs.AI ↗ · 2026-06-03 缓存

本文将LLM推理预算分配形式化为一个约束优化问题，提出CLEAR方法，将资源从低效用查询重新分配到接近涌现阈值的查询，在预算紧张的情况下实现了高达3倍的准确率提升。

0 人收藏 0 人点赞

#resource-management

arXiv cs.AI ↗ · 2026-06-01 缓存

本文提出HADT，一种基于Transformer的架构，用于异构卫星集群在执行地球观测任务时的自主资源管理，采用差分注意力和关系化令牌化机制。实验表明，该方法相较于基线有显著改进，并对不同规模的卫星集群展现出强适应性和迁移能力。

0 人收藏 0 人点赞

#resource-management

arXiv cs.AI ↗ · 2026-05-11 缓存

本文提出了在线共享库存分配问题，并设计了一种确定性的阈值比例策略（GPA），该策略能达到离线最优解的 4/3 近似比。文章还介绍了一种学习增强型扩展方法，以处理不完美的预测，并在合成数据及真实世界实验中展示了其优越的性能。

0 人收藏 0 人点赞

#resource-management

arXiv cs.AI ↗ · 2026-05-08 缓存

本文介绍了 RGAO，这是一种用于多智能体代码生成的检索引导自适应编排框架，可根据代码复杂度动态选择拓扑结构。它提供了一种形式化的预算代数，在显著降低相较于基线方法的路由错误率的同时，确保了资源的可证明守恒。

0 人收藏 0 人点赞

#resource-management

Reddit r/MachineLearning ↗ · 2026-04-23

一场 Kaggle 比赛要求选手构建调度器，针对 MMLU 问题决定是否运行 2B 参数模型，以在计算开销与准确率之间加权最小化总成本。

0 人收藏 0 人点赞