标签
本文将LLM推理预算分配形式化为一个约束优化问题,提出CLEAR方法,将资源从低效用查询重新分配到接近涌现阈值的查询,在预算紧张的情况下实现了高达3倍的准确率提升。
本文提出HADT,一种基于Transformer的架构,用于异构卫星集群在执行地球观测任务时的自主资源管理,采用差分注意力和关系化令牌化机制。实验表明,该方法相较于基线有显著改进,并对不同规模的卫星集群展现出强适应性和迁移能力。
本文提出了在线共享库存分配问题,并设计了一种确定性的阈值比例策略(GPA),该策略能达到离线最优解的 4/3 近似比。文章还介绍了一种学习增强型扩展方法,以处理不完美的预测,并在合成数据及真实世界实验中展示了其优越的性能。
本文介绍了 RGAO,这是一种用于多智能体代码生成的检索引导自适应编排框架,可根据代码复杂度动态选择拓扑结构。它提供了一种形式化的预算代数,在显著降低相较于基线方法的路由错误率的同时,确保了资源的可证明守恒。
一场 Kaggle 比赛要求选手构建调度器,针对 MMLU 问题决定是否运行 2B 参数模型,以在计算开销与准确率之间加权最小化总成本。