resource-management

标签

Cards List
#resource-management

推理的影子价格:LLM最优预算分配的经济学视角

arXiv cs.AI · 6天前 缓存

本文将LLM推理预算分配形式化为一个约束优化问题,提出CLEAR方法,将资源从低效用查询重新分配到接近涌现阈值的查询,在预算紧张的情况下实现了高达3倍的准确率提升。

0 人收藏 0 人点赞
#resource-management

HADT: 一种用于自主地球观测卫星集群的异构多智能体差分Transformer

arXiv cs.AI · 2026-06-01 缓存

本文提出HADT,一种基于Transformer的架构,用于异构卫星集群在执行地球观测任务时的自主资源管理,采用差分注意力和关系化令牌化机制。实验表明,该方法相较于基线有显著改进,并对不同规模的卫星集群展现出强适应性和迁移能力。

0 人收藏 0 人点赞
#resource-management

未知共享库存的在线分配

arXiv cs.AI · 2026-05-11 缓存

本文提出了在线共享库存分配问题,并设计了一种确定性的阈值比例策略(GPA),该策略能达到离线最优解的 4/3 近似比。文章还介绍了一种学习增强型扩展方法,以处理不完美的预测,并在合成数据及真实世界实验中展示了其优越的性能。

0 人收藏 0 人点赞
#resource-management

用于多智能体代码生成的检索条件拓扑选择及其可证明的预算守恒

arXiv cs.AI · 2026-05-08 缓存

本文介绍了 RGAO,这是一种用于多智能体代码生成的检索引导自适应编排框架,可根据代码复杂度动态选择拓扑结构。它提供了一种形式化的预算代数,在显著降低相较于基线方法的路由错误率的同时,确保了资源的可证明守恒。

0 人收藏 0 人点赞
#resource-management

用还是不用 2B?自定义 LLM 调度挑战赛 [P]

Reddit r/MachineLearning · 2026-04-23

一场 Kaggle 比赛要求选手构建调度器,针对 MMLU 问题决定是否运行 2B 参数模型,以在计算开销与准确率之间加权最小化总成本。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈